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La presente invention a pour objet la mise en evidence de sequences nucieotidiques et peptidiques permettant notamment de distinguer, 
en terme de diagnostic, une immunisation resultant d'une vaccination par le BCG d'une infection par M. tuberculosis. Les sequences en 
question sont specifiques soit de M. bovis BCG/£i(M. bovis), soit de M. tuberculosis. La pr6sente invention a dgalement pour objet un 
proc6de* de detection des sequences en question, un proce^de* pour la d6tection d'anticorps gendres par les produits d'expression de ces 
sequences ainsi que les kits pour mettre en oeuvre ces process. Enfin, la presente invention a pour objet de nouveaux vaccins. 
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SEQUENCES DELETEES CHEZ M. BO VIS BCG / M. BOVIS 
OU M. TUBERCULOSIS, PROCEDE DE DETECTION DES 
MYCOBACTERIES UTELISANT CES SEQUENCES ET VACCINS 

5 La presente invention a pour objet la mise en evidence de 

sequences nucleotidiques permettant notamment de distinguer, en terme de 
diagnostic, une immunisation resultant d'une vaccination par le BCG d'une 
infection par M. tuberculosis. Les sequences en question sont specifiques 
soit de M. bovis BCG/ M bovis, soit de M. tuberculosis. La presente 

10 invention a egalement pour objet un procede de detection des sequences en 
question, un procede pour la detection d'anticorps generes par les produits 
d'expression de ces sequences ainsi que les kits pour mettre en oeuvre ces 
procedes. Enfin, la presente invention a pour objet de nouveaux vaccins. 

Le taux important de mortalite et de morbidite cause par 

15 Mycobacterium tuberculosis, V agent etiologique de la tuberculose, genere 
la necessite de developper de nouveaux vaccins et des traitements chimio- 
therapeutiques toujours plus courts. En efFet, l'apparition de souches de 
M. tuberculosis resistantes aux anti-tuberculeux et le risque accru chez les 
patients immunodeprimes, par exemple chez les patients atteints du sida, de 

20 developper une tuberculose, rend necessaire la mise au point de methodes 
rapides, specifiques et fiables pour le diagnostic de la tuberculose et la mise 
au point de nouveaux vaccins. Le vaccin BCG conventionnel derive d'une 
souche de Mycobacterium bovis qui a ete attenuee par des passages en serie 
repetes sur de l'agar de bile pomme de terre-glycerinox (Calmette, 1927 ; 

25 Bloom and Fine, 1994). Cependant, malgre presque 50 ans d'utilisation 
mondiale, la raison de V attenuation de M bovis BCG est encore inconnue. 
Des questions persistent quant a la protection conferee par le vaccin contre 
la tuberculose pulmonaire, avec une efficacite comprise entre 0 et 80 % 
(Fine, 1994). De plus, de nombreuses sous-souches de BCG existent et 
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ofFrent des niveaux varies de protection contre la tuberculose dans un 
modele de souris (Lagranderie et al., 1996). L'attenuation de la souche 
d'origine de M. bovis peut avoir ete causee par des mutations dans le 
genome du bacille qui ont ete selectionnees durant les passages en serie de 
5 la souche, mutations qui sont restees stables dans le genome. Cependant, 
comme la souche deM. bovis d'origine est perdue, la comparaison directe 
de cette derniere avec M. bovis BCG est impossible. Malgre cela, 
F identification de differences genetiques entre M bovis, M. bovis BCG et 
M tuberculosis est susceptible de reveler des localisations dont 1' alteration 

10 aurait pu conduire a T attenuation deM bovis BCG. 

L/ADN de M tuberculosis a plus de 99,9 % d'homologie avec 
l'ADN des autres membres du complexe tuberculeux (M bovis, M microti, 
M africanum). Bien que tres apparentees, ces souches peuvent etre 
differenciees sur la base de leur gamme d'hote, de leur virulence pour 

15 FHomme et de leurs caracteristiques physiologiques (Heifets and Good, 
1994). Comme dans le cas de l'attenuation du BCG, la base genetique pour 
les differences phenotypiques entre les bacilles tuberculeux est largement 
inconnue. Cependant, la richesse de rinformation contenue dans la 
sequence genomique de M tuberculosis H37Rv donnait lieu a penser que 

20 les variations genetiques entre les souches allaient etre mises a jour (Cole et 
al., 1998). La comparaison genomique presente un outil puissant pour de 
telles recherches puisque les genomes entiers peuvent etre etudies de 
preference a 1'etude des genes dans leur individualite. Une precedente etude 
comparative de M. bovis et M bovis BCG par hybridation genomique 

25 soustractive a montre que trois regions, designees RD1, RD2 et RD3 etaient 
deletees dans M. bovis BCG comparativement a M bovis (Mahairas et al., 
1996). Cependant, le role, le cas echeant, de ces regions dans Pattenuation 
de M bovis BCG n'a pas ete clairement etabli. De fa<?on similaire, d'autres 
etudes des differences genomiques entre M bovis, M bovis BCG et 
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M tuberculosis ont montre que de nombreuses localisations 
polymorphiques existaient entre ces souches (Philipp et al., 1996). Bien que 
la nature exacte de ces polymorphismes n'ait pas ete eclaircie, des analyses 
supplementaires ont revel e qu'un polymorphisme etait du a la deletion de 
5 12,7 kb dans M bovis et BCG comparativement a M tuberculosis (Brosch 

et al., 1998). A partir de la, il apparait qu'il existe deux classes de deletion : 
celles qui sont absentes de BCG mais presentes dans M. bovis et M. 
tuberculosis et celles qui sont absentes de M bovis et BCG mais presentes 
dansM tuberculosis. 

10 La banque de chromosome artificiel bacterien (BAC) de 

M tuberculosis H37Rv deposee a la CNCM sous le n° 1-1945 le 
19 novembre 1997 et decrite dans la demande W09954487 temoigne de la 
connaissance complete de la sequence genomique de M tuberculosis et 
presente un potentiel en tant qu'outil pour les applications postgenomiques 

15 telles que les comparaisons genomiques (Brosch et al., 1998). Afin de 
pousser plus avant les investigations dans les differences genomiques entre 
M tuberculosis et M bovis BCG, les inventeurs ont prepare une bahque 
BAC de M bovis BCG deposee le 30 juin 1998 a la CNCM sous le n° I- 
2049 et decrite dans la demande W09954487. Ce type de banque presente 

20 en effet certains avantages. Premierement, le systeme BAC peut maintenir 
de larges inserts de DNA mycobacteriens, jusqu'a 120 kb. Les 4,36 Mb du 
genome de M bovis BCG pouvaient dont etre representees dans 50 a 60 
clones, simplifiant le stockage et la manipulation de la banque. 
Deuxiemement, le systeme BAC peut permettre en toute confiance de 

25 repliquer les inserts sans generer de rearrangement ou de deletion dans les 
clones. De la, les alterations de V insert ne peuvent pas etre a Torigine 
d'erreur pour la variation dans le genome. Troisiemement, le 
positionnement des clones BAC sur le chromosome de M. bovis BCG est 
susceptible de generer une carte de clones se chevauchant ce qui devrait 
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permettre la comparaison directe des segments locaux sur le genome de M 
tuberculosis et de M bovis BCG, tout en etant une ressource interessante 
pour !e sequencage du genome de M. bovis BCG. 

La construction d'une banque BAC de M bovis BCG-Pasteur (I- 
2049) est decrite ci-apres ainsi que son utilisation, en conjonction avec la 
banque BAC deM tuberculosis H37Rv (1-1945), en tant qu'outil pour les 
comparaisons genomiques. Avec cette approche, les inventeurs ont pu 
identifier de nouvelles deletions et insertions entre les bacilles tuberculeux 
ce qui permet d'avoir un apercu dans deux genomes de la dynamique et de 
la differentiation dans le complexe deM tuberculosis. 

La voie principale pour extraire 1' information biologique a partir 
du genome est la comparaison entre les genomes. La technologie des bio- 
puces ou « chips d'ADN » (Chee et al., 1996 ; DeRisi et al., 1997) decrite 
par exemple dans les brevets n° WO97/02357 et n° W097/29212 permet 
d'effectuer les alignements et de selectionner les sequences d'interet . Par 
ailleurs, la disponibilite d'un jeu minimum de clones de BAC pour les 
genomes de M. bovis BCG et M. tuberculosis H37Rv a procure aux 
inventeurs des outils prets a l'emploi pour les susdites etudes comparatives. 
La banque de BAC deM bovis BCG contient plus de 1 500 clones avec une 
taille moyenne des inserts d'environ 75 kb. 57 clones couvrent le genome 
de BCG incluant un fragment Hindm de 120 kb qui etait absent de la 
banque de BAC de M tuberculosis. La construction des puces de BAC a 
partir de la banque de M bovis BCG devait permettre aux inventeurs 
d'etendre leurs etudes comparatives concernant le bacille tuberculeux. Ces 
fragments peuvent s'hybrider avec de PADN genomique a partir d'isolats 
cliniques de M. tuberculosis ou des souches epidemiques pour identifier 
d'autres deletions ou rearrangements, et de la, permettre un nouvel apercu 
concernant la plasticite du genome ainsi que 1' identification des genes et des 
produits des genes qui peuvent etre impliques dans la virulence. 
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A Tissue d' experimentations reportees ci-apres, les inventeurs ont 
identifie 10 localisations ou loci qui sont absents dans M bovis BCG 
comparativement a M tuberculosis. Des hybridations avec TADN 
genomique de M. bovis ont revele que 7 de ces loci etaient egalement 
5 deletes dans M bovis comparativement a M tuberculosis. Ainsi, dans le 
texte ci-apres, a chaque fois qu'il sera question de caracteristiques 
communes au genome de M bovis BCG et a celui de M bovis, il sera 
indique qu'il s'agit du « genome deM bovis BCG /M bovis ». 

II s'est ensuite avere que 3 des deletions specifiques apparaissant 
10 dans M bovis BCG etaient identiques aux regions RD1, RD2 et RD3 
defmies par Tequipe de Stover (Mahairas et al., 1996). Ainsi, en gardant la 
precedente nomenclature, les inventeurs ont appele les 7 autres deletions du 
genome deM bovis BCG I M. bovis, RD4, RD5, RD6, RD7, RD8, RD9 et 
RD10. 

15 D'autres deletions se sont revelees etre specifiques du genome de 

M tuberculosis etant entendu que les sequences « correspondantes » etaient 
presentes chez M bovis BCG I M. bovis ; elles ont ete appelees RvDl et 
RvD2 (Tableaux 1 et 2). 

Les deletions RD5-RD10, RvDl et RvD2 ont permis aux 

20 inventeurs d' identifier de maniere approfondie la dynamique du genome 
dans le bacille tuberculeux et ont donne des indications relatives aux bases 
genetiques de la differentiation phenotypique du complexe. L' identification 
de RvDl et RvD2 en tant que deletions du genome de M tuberculosis 
H37Rv montre que le processus de deletion ne fonctionne pas dans un seul 

25 sens, et la perte d'informations peut done avoir lieu a la fois dans les 
souches bovines et dans les souches humaines. On constate que 8 des 10 
deletions detectees sont localisees dans une region du chromosome ou la 
terminaison de la replication a probablement lieu. 
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Les inventeurs ont ensuite, au sein de chaque region deletee, mis 
en evidence plusieurs ORFs (ou cadres ouverts de lecture) ou genes et ils 
ont tente de determiner la fonction putative de chacun d'eux (Tableau 1). 

La presente invention a done pour objet des sequences 
nucleotidiques deletees du genome deM bovis BCG / M. bovis et presentes 
dans le genome de M tuberculosis ou inversement choisies parmi les ORFs 
et genes suivants : Rv2346c, Rv2347c, Rv2348c, plcC, plcB, plcA, 
Rv2352c, Rv2353c, Rv3425, Rv3426, Rv3427c, Rv3428c, Rvl964, 
Rvl965, mce3, Rvl967, Rvl968, Rvl969, IprM, Rvl971, Rvl972, Rvl973, 
Rvl974, Rvl975, Rvl976c, Rvl977, ephA, Rv3618, Rv3619c, Rv3620c, 
Rv3621c, Rv3622c, IpqG, cobL, Rv2073c, Rv2074, Rv2075, echAl, 
Rv0223c, RvDl-ORFl, RvDl-ORF2, Rv2024c, plcD, RvD2-ORFl, RvD2- 
ORF2, RvD2-ORF3, Rvl758. 

Par « sequence nucleotidique » selon la presente invention, on 
entend aussi bien un ADN double brin, un ADN simple brin que des 
produits de transcription desdits ADN. 

Plus particulierement, les sequences nucleotidiques ci-dessus 
enumerees sont regroupees en regions nucleotidiques selon la repartition 
suivante : 

- RD5 : Rv2346c, Rv2347c, Rv2348c, plcC, plcB, plcA. Rv2352c, 
Rv2353c, 

- RD6 : Rv3425, Rv3426, Rv3427c, Rv3428c, 

- RD7: Rvl964, Rvl965, mce3 y Rvl967, Rvl968, Rvl969, IprM, 
Rvl971, Rvl972, Rvl973, Rvl974, Rvl975, Rvl976c, Rvl977, 

- RD8 : ephA, Rv3618, Rv3619c, Rv3620c, Rv3621c, Rv3622c, IpqG, 

- RD9 : cobL, Rv2073c, Rv2074, Rv2075, 

- RD10 : echAl, Rv0223c, 

- RvD 1 : RvD 1 -ORF 1 , RvD 1 -ORF2, Rv2024c, 

- RvD2 : plcD, RvD2-ORFl , RvD2-ORF2, RvD2-ORF3, Rvl 758. 
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De fa^on interessante, 3 des deletions (RD5, RD6 et RD8) 
contiennent 6 genes codant pour des proteines PE et PPE. Comme il a ete 
suggere que ces proteines ont un role eventuel dans la variation antigenique 
(Cole et al., 1998), on peut en deduire que ces loci peuvent represent er des 
5 sites d'hypervariabilite entre les souches tuberculeuses. 

Au moins 9 proteines susceptibles d'etre exportees ou exposees a 
la surface sont codees par RD4 a RD10, ce qui indique que ces polypeptides 
ont peut-etre un role important dans la reconnaissance immunitaire du 
bacille. II a en effet ete montre que des polypeptides secretes peuvent avoir 

10 un role de stimulateur potentiel dans le systeme immunitaire et ils sont 
susceptibles de jouer un role d'antigenes connus pour intervenir pendant 
Petape precoce de l'infection (Elhay et al., 1998 ; Horwitz et al., 1995 ; 
Rosenkrands et al., 1998). 

Le fait que RD5 et RD6 contiennent des genes codant pour des 

15 proteines appartenant a la famille de ESAT-6 dont 14 sont organisees en 1 1 
loci distincts est particulierement significatif (F. Tekaia, S. Gordon, T. 
Gamier, R. Brosch, B.G. Barrell and S.T. Cole, soumis). ESAT-6 est un 
antigene a cellule T majeur qui semble etre secrete par le bacille 
tuberculeux virulent d'une maniere independante du peptide signal (Harboe 

20 et al., 1996). II s'accumule dans le milieu extracellulaire pendant les phases 
precoces de croissance et son gene est localise dans RD1, une region qui est 
deletee du genome deM bovis BCG (Mahairas et al., 1996 ; Philipp et al., 
1996). 3 des 10 regions RD contiennent ainsi des genes de la famille de 
ESAT-6, ce qui indique que d'autres sites de genes ESAT-6 peuvent aussi 

25 donner lieu a des deletions ou des rearrangements. 

La sequence genomique de M tuberculosis H37Rv a par ailleurs 
revele la presence de 4 genes hautement apparentes codant pour des 
enzymes de phospholipase C appelees plcA, plcB, plcC et plcD (Cole et al., 
1998). La phospholipase C a ete reconnue comme facteur de virulence 
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important dans un certain nombre de bacteries incluant 
Clostridium perfringens, Listeria monocytogenes et Pseudomonas 
aeruginosa ou elle joue un role intracellular dans la dissemination des 
cellules bacteriennes, dans la survivance intracellulaire et dans la cytolyse 
(Titball, 1993). La deletion RD5 englobe 3 genes (plcA, plcB et plcQ, cette 
region etant absente de M. bovis, M bovis BCG et M microti. La mise en 
evidence de I'activite de la phopholipase C dans 
M. tuberculosis, M. microti et M. bovis mais pas dans M. bovis BCG, a ete 
precedemment decrite (Johansen et al., 1996 ; Wheeler et Ratledge, 1992) 
ainsi que le role des enzymes codees par plcA et plcB (egalement connues 
sous la denomination mpcA et mpcE) dans l'hydrolyse a la fois de la 
phosphatidylcholine et de la sphingomyelins Les niveaux de I'activite de 
phospholipase C detectes dans M bovis sont tres inferieurs a ceux observes 
dans M tuberculosis qui sont en concordance avec la perte de plcABC, 
I'activite de la sphingomyelinase etant encore detectable. Les donnees de 
sequences presentees ici montrent que la phospholipase dans sa pleine 
longueur est codee par le gene plcD dans M. bovis BCG-Pasteur et que son 
importante similarity de sequence avec les produits de plcA et plcB indique 
qu'elle est probablement dotee a la fois d'une activite phospholipase et d'un 
activite sphingomyelinase. II est done probable que plcD puisse etre 
responsable de I'activite residuelle de phospholipase C dans les souches 
presentant la deletion RD5, tel que M bovis, bien qu'il soit difficile de 
relier cette interpretation a l'absence observee de phospholipase C en depit 
de la presence de sphingomyelinase dans la souche de M. bovis BCG 
utilisee dans d'autres etudes (Johansen et al., 1996 ; Wheeler et Raledge, 
1992). Les etudes de I' expression avec le gene plcD clone devraient 
clarifier ce point. 

Le gene mce a ete decrit par l'equipe de Riley comme codant pour 
une proteine putative de M. tuberculosis de type invasine, dont l'expression 
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dans E. coli permet Tinvasion des cellules HeLa (Arruda et al., 1993): Trois 
autres proteines Mce ont ete identifies comme parties du projet de 
sequenfage du genome avec leur gene occupant la meme position dans 
quatre grands operons tres conserves comprenant au moins huit genes 
5 (Cole et al., 1998 ; Harboe et al, 1996). II est difficile de deduire les effets 
de la perte de mce3 (RD7) surM bovis, M microti etM bovis BCG du fait 
que les trois copies de mce restantes pourraient complementer toute perte 
d'activite, a moins que les operons ne soient exprimes differentiellement. 
Cependant, il est interessant de noter que RD7 est absent de certains 

10 membres du complexe de M. tuberculosis qui ne sont pas virulents pour 
l'Homme suggerant que RD7 puisse jouer un role specifique dans la 
maladie humaine. 

Le genome de M tuberculosis H37Rv code egalement pour six 
proteines (EphA-F) qui montrent une similarite avec des hydrolases 

15 epoxydes tandis qu'au moins 21 hydratases enoyle CoA (EchAl-21) et de 
multiples aldehydes dehydrogenases sont presentes (Cole et al., 1998). La 
perte de ephA (RD8), echAl et Paldehyde dehydrogenase codee par 
Rv0223c (RD10) chez M. bovis BCG /M bovis peut done etre compensee 
par d' autres enzymes bien que la specificite du substrat des enzymes de M. 

20 tuberculosis soit inconnue. Les hydrolases epoxydes sont generalement 
considerees comme des enzymes de detoxification ; un recent rapport a 
encore montre qu'elles jouent un role dans l'activation des leucotoxines 
(Moghaddam et al., 1997), un acide gras toxique produit par les leucocytes 
qui sont impliques dans le syndrome de detresse respiratoire chez Fadulte. 

25 Cependant, la question de savoir si les hydrolases epoxydes de M. 

tuberculosis peuvent modifier chimiquement des chimiokines hotes est sans 
reponse. Alternativement, elles peuvent jouer un role dans la detoxification 
lipidique des produits de peroxydation generes par les radicaux oxygenes a 
partir de macrophages actives. 
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RD9 est une region deletee des genomes de M africanum, 
M bovis, M. bovis BCG et M. microti comparativement a M tuberculosis. 
En consequence, en opposition avec les autres regions RD, la localisation de 
M. africanum est proche de M. bovis, ce qui indique la presence de cette 
souche entreM tuberculosis etM bovis (Heifets et Good, 1994). De fa<?on 
similaire, la region RD4 peut differencier M microti des souches bovines 
(Tableau 2). 

Les proteines codees par RD4 a RD10 peuvent done presenter des 
antigenes interessants, permettant la discrimination d'individus vaccines par 
le BCG de patients infectes par M tuberculosis. 

Ainsi, la presente invention a egalement pour objet un procede de 
detection et d'identification discriminante de M bovis BCG /M bovis ou 
M. tuberculosis dans un echantillon biologique, comprenant les etapes 
suivantes : 

a) isolement de l'ADN a partir de Pechantillon biologique a 
analyser ou obtention d'un ADNc a partir de TARN de 
Pechantillon biologique, 

b) detection des sequences d'ADN de la mycobacterie presente 
dans ledit echantillon biologique, 

c) analyse desdites sequences. 

De preference, dans le cadre de la presente invention, Pechantillon 
biologique est constitue par un fluide, par exemple du serum humain ou 
animal, du sang, une biopsie, du liquide broncho-alveolaire ou du liquide 
pleural. 

L'analyse des sequences recherchees peut par exemple etre realisee 
par une electrophorese sur gel d'agarose. Si Pon observe la presence d'un 
fragment d'ADN migrant a Pendroit attendu, on peut conclure que 
Pechantillon analyse contenait de PADN de mycobacterie. Cette analyse 
peut egalement etre realisee par la technique d'hybridation moleculaire en 
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utilisant une sonde nucleique. Cette sonde sera avantageusement marquee 
par un element non radioactif (sonde froide) ou radioactif 

Avantageusement, la detection des sequences d'ADN des 
mycobacteries sera realisee au moyen de sequences nucleotidiques 
5 complementaires desdites sequences d'ADN. A titre d'exemple, il pourra 
s'agir de sondes nucleotidiques marquees ou non marquees ; il pourra 
egalement s'agir d'amorces en vue d'une amplification. 

La technique d'amplification utilisee peut etre la PCR mais 
egalement d'autres techniques alternatives comme la technique SDA 
10 (Strand Displacement Amplification) ou technique d'amplification a 
deplacement de brins, la technique TAS (Transcription-based Amplification 
System), la technique NASBA (Nucleic Acid Sequence Based 
Amplification) ou la technique TMA (Transcription Mediated 
Amplification). 

15 Les amorces conformes a l'invention ont une sequence 

nucleotidique choisie dans le groupe comprenant SEQ ID N° 1, SEQ DD N° 
2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, 
SEQ ID N° 8, SEQ ID N° 9, SEQ ID N° 10, SEQ ID N° 1 1 SEQ ID N° 12, 
SEQ ID N° 13, SEQ ID N° 14, SEQ ED N° 15, SEQ ID N° 16, SEQ ID N° 

20 17 et SEQ ID N° 18 avec : 

- le couple SEQ ID N° 1 / SEQ ID N° 2 specifique de RD4, 

- le couple SEQ ED N° 3 / SEQ ID N° 4 specifique de RD5, 

- le couple SEQ ID N° 5 / SEQ ID N° 6 specifique de RD6, 

- le couple SEQ ID N° 7 / SEQ ID N° 8 specifique de RD7, 
25 - le couple SEQ ID N° 9 / SEQ ID N° 1 0 specifique de RD8, 

- le couple SEQ ID N° 1 1 / SEQ ID N° 12 specifique de RD9, 

- le couple SEQ ID N° 1 3 / SEQ ED N° 14 specifique de RD10, 

- le couple SEQ ID N° 15 / SEQ ID N° 16 specifique de RvDl, et 

- le couple SEQ ID N° 1 7 / SEQ ID N° 1 8 specifique de RvD2, 
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Dans une variante, Tinvention a egalement pour objet un procede 
de detection et d'identification discriminante de M. bovis BCG /M bovis 
ou M. tuberculosis dans un echantillon biologique comprenant les etapes 
suivantes : 

5 a) mise en contact de Techantillon biologique a analyser avec au 

moins un couple d'amorces tel que defini ci-dessus, l'ADN 
contenu dans Techantillon ayant ete, le cas echeant, 
prealablement rendu accessible a l'hybridation, 
b) amplification de FADN de la mycobacterie, 
10 c) mise en evidence de P amplification des fragments d'ADN. 

Les fragments amplifies peuvent etre identifies par une 
electrophorese en gel d'agarose ou de polyacrylamide, par une 
electrophorese capillaire ou encore par une technique chromatographique 
(filtration sur gel, chromatographic hydrophobe ou chromatographic 
15 echangeuse d'ions). La specification de l'amplification peut etre controlee 
par hybridation moleculaire en utilisant des sondes, des plasmides contenant 
ces sequences ou leur produit d'amplification. 

Les fragments nucleotidiques amplifies peuvent etre utilises 
comme reactif dans des reactions d'hybridation afin de mettre en evidence 
20 la presence, dans un echantillon biologique, d'un acide nucleique cible de 
sequences complementaires a celles desdits fragments nucleotidiques 
amplifies. 

Ces sondes et amplicons peuvent etre marques ou non par des 
elements radioactifs ou par des molecules non radioactives telles que des 
25 enzymes ou des elements fluorescents. 

La presente invention a egalement pour objet un kit pour la 
detection et Identification discriminante de M. bovis BCG / M bovis ou 
M. tuberculosis dans un echantillon biologique comprenant les element 
suivants : 
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a) au moins un couple d'amorces tel que defini ci-dessus, 

b) les reactifs necessaires pour efFectuer une reaction 
d'amplification d'ADN, 

c) eventuellement, les elements necessaires permettant de verifier 
5 ou comparer la sequence et/ou la taille du fragment amplifie. 

En efFet, dans le cadre de la presente invention, en fonction du 
couple d' amorces utilise, on peut obtenir des resultats tres differents. Ainsi 
l'utiiisation d'amorces internes a la deletion, telles qu'elles sont decrites 
dans la presente invention pour RD4, RD5 et RD8, fait qu'aucun produit 

10 d'amplification n'est detectable chez M. bovis BCG. Cependant, 
l'utiiisation d'amorces externes a la zone de deletion ne donne pas 
necessairement le meme resultat, en ce qui concerne par exemple la taille du 
fragment amplifie, en fonction de I' importance de la zone deletee chez 
M bovis BCG. Ainsi, l'utiiisation du couple d'amorces SEQ ID N° 5 / 

15 SEQ ID N° 6 pour la detection de RD6 est susceptible de donner lieu a un 
amplicon chez M bovis BCG d'environ 3 801 pb alors que la mise en 
oeuvre du couple d'amorces SEQ ID N° 11/ SEQ ID N° 12 pour la 
detection de RD9 donnera lieu chezM bovis BCG a un amplicon d'environ 
1018pb. 

20 L'invention a egalement pour objet l'utiiisation d'au moins un 

couple d'amorces tel que defini ci-dessus pour Famplification de sequences 
d'ADN de M bovis BCG / M. bovis ou M tuberculosis. 

L'interet de l'utiiisation de plusieurs couples d'amorces sera bien 
evidemment de croiser les resultats obtenus avec chacun d'eux pour affiner 

25 le resultat de Panalyse. En efFet, lorsqu'il est indique, dans le cadre de la 
presente invention, que certaines deletions sont specifiques de M bovis 
BCG / M bovis, cela n'est pas tout a fait exact puisque certaines d'entre 
elles sont egalement retrouvees chez M microti OV254, chez 
M tuberculosis CSU#93 et chez M. africanum ainsi que chez certains 
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isolats cliniques (Tableau 2). Ainsi, I'utilisation du couple d'amorces SEQ 
ID N° 1 / SEQ ID N° 2 specifique de la region RD4 ne donnera pas lieu a 
des amplicons de taille normale avec M. bovis BCG / M. bovis dans 
Techantillon biologique. En revanche si le couple d'amorces utilise est SEQ 
5 ID N° 5 / SEQ ID N° 6 specifique de RD6 et que des amplicons de taille 
normale ne sont pas retrouves, il ne sera pas possible, a partir de ce seul 
resultat, de discriminer entre la presence, dans l'echantillon biologique, de 
M bovis BCG I M. bovis, M. microti OV254 etM tuberculosis CSU#93. 

La discrimination sera plus radicale quand il s'agira de determiner 
10 si la mycobacterie presente dans l'echantillon biologique a analyser est 
M bovis BCG / M bovis ou M tuberculosis H37Rv car les couples 
d'amorces SEQ ID N° 15 / SEQ ID N° 16 et SEQ ED N° 17/ SEQ ID N° 18 
ne sont specifiques que de M tuberculosis H37Rv. Par consequent, 
F absence d'amplicon de taille normale lors de I'utilisation de Tun ou Pautre 
15 de ces couples d'amorces pourra etre consideree comme significative de la 
presence deM tuberculosis H37Rv dans l'echantillon biologique analyse. 

La presente invention a egalement pour objet les produits 
d'expression de tout ou partie des sequences nucleotidiques deletees du 
genome de M bovis BCG / M. bovis et presentes dans M tuberculosis ou 
20 inversement telles qu'enumerees dans le Tableau 1 . 

Par « produit d'expression », on entend toute proteine, polypeptide 
ou fragment polypeptidique resultant de Texpression de tout ou partie des 
susdites sequences nucleotidiques et de preference presentant ou moins 
Tune des caracteristiques suivantes : 
25 - capacite a exporter ou secreter par une mycobacterie et ou etre 

induit ou reprime lors de 1'infection par la mycobacterie, et/ou 
- capacite a induire, reprimer ou moduler directement ou 
indirectement, un facteur de virulence de mycobacterie, et /ou 
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- capacite a induire une reaction d'immunogenicite dirigee contre 
une mycobacterie, et/ou 

- capacite a etre reconnu par un anticorps specifique de 
mycobacterie. 

5 En efFet, la presente invention a egalement pour objet un precede 

de detection discriminante in vitro d'anticorps diriges contre M bovis BCG 
/ M bovis ou M tuberculosis dans un echantillon biologique, comprenant 
les etapes suivantes : 

a) mise en contact de F echantillon biologique avec au moins un 
10 produit d'expression tel que ci-dessus defini, 

b) mise en evidence du complexe antigene - anticorps forme. 

L' invention a egalement pour objet un procede de detection 
discriminante d'une vaccination avecM bovis BCG ou d'une infection par 
M tuberculosis chez un mammifere, comprenant les etapes suivantes : 
15 a) preparation d'un echantillon biologique contenant des cellules, 

plus particulierement des cellules du systeme immunitaire dudit 
mammifere et plus particulierement encore, des cellules T, 

b) incubation de Techantillon biologique de l'etape a) avec au 
moins un produit d'expression conforme a la presente 

20 invention, 

c) detection d'une reaction cellulaire indiquant une sensibilisation 
prealable du mammifere audit produit, notamment la 
proliferation cellulaire et/ou la synthese de proteines telles que 
1' interferon gamma. 

25 La proliferation cellulaire pourra etre mesuree par exemple par 

incorporation de 3 H-Thymidine. 

L' invention concerne egalement un kit pour le diagnostic in vitro 
d'une infection par M. tuberculosis chez un mammifere eventuellement 
prealablement vaccine avecM. bovis BCG comprenant : 
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a) un produit d' expression conforme a la presente invention, 

b) le cas echeant, les reactifs pour la constitution du milieu 
propice a la reaction immunologique, 

c) les reactifs permettant la detection des complexes antigene - 
5 anticorps produits par la reaction immunologique, 

d) le cas echeant, un echantillon biologique de reference (temoin 
negatif) depourvu d' anticorps reconnus par ledit produit, 

e) le cas echeant, un echantillon biologique de reference (temoin 
positif) contenant une quantite predeterminee d'anticorps 

10 reconnus par ledit produit. 

Les reactifs permettant la detection des complexes antigene - 
anticorps peuvent porter un marqueur ou etre susceptibles d'etre reconnus a 
leur tour par un reactif marque, plus particulierement dans le cas ou 
T anticorps utilise n'est pas marque. 

15 L' invention a egalement pour objet des anticorps mono- ou 

polyclonaux, leurs fragments ou anticorps chimeriques, capables de 
reconnaitre specifiquement un produit d'expression conforme a la presente 
invention. 

La presente invention concerne done egalement un precede pour la 
20 detection discriminate de la presence d'un antigene de M bovis BCG / 
M bovis ou de M tuberculosis dans un echantillon biologique comprenant 
les etapes suivantes : 

a) mise en contact de Techantillon biologique avec un anticorps 
conforme a Tinvention, 
25 b) mise en evidence du complexe antigene - anticorps forme. 

L' invention concerne egalement le kit pour la detection 
discriminate de la presence d'un antigene de M bovis BCG / M. bovis ou 
de M. tuberculosis dans un echantillon biologique comprenant les elements 
suivants : 
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a) un anticorps conforme a 1' invention, 

b) ies reactifs pour la constitution du milieu propice a la reaction 
immunologique, 

c) les reactifs permettant la detection des complexes antigene - 
5 anticorps produits par la reaction immunologique. 

Les reactifs ci-dessus mentionnes sont bien connus de Phomme du 
metier qui n'aura aucune difficulte a les adapter au contexte de la presente 
invention. 

L' invention a egalement pour objet une composition immunogene 

10 caracterisee en ce qu'elle comprend au moins un produit d'expression 
conforme a T invention. 

Avantageusement, la composition immunogene conforme a 
l'invention entre dans la composition d'un vaccin lorsqu'elle est presentee 
en association avec un vehicule pharmaceutiquement acceptable et 

15 eventuellement avec un ou plusieurs adjuvant(s) de l'immunite tel que 
l'alun ou un representant de la famille des muramylpeptides ou encore 
d'adjuvant incomplet de Freund. 

L'invention vise egalement un vaccin comprenant au moins un 
produit d'expression conforme a l'invention en association avec un vehicule 

20 pharmaceutiquement compatible et le cas echeant, un ou plusieurs 
adjuvant(s) de l'immunite approprie(s). 

Les connaissances standards sur 1'evolution du complexe de 
M tuberculosis sont basees sur I'hypothese que M tuberculosis est derive 
deM bovis (Sreevatsan et al., 1997). Cependant, la distribution de RD1 a 

25 RD10 parmi le complexe tuberculeux suggere qu'une evolution lineaire de 
M tuberculosis a partir de M bovis est trop simpliste. II apparait en effet, 
de fafon plus probable, que les deux bacilles sont derives d'une souche- 
mere commune, que les deletions refletent done 1' adaptation des bacilles a 
leur niche particuliere, e'est-a-dire que la perte de RD4 a RD10 a 
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probablement aide M bovis a devenir un agent pathogene des bovins plus 
puissant que M tuberculosis. Des etudes genomiques fonctionnelles 
determineront que] role ces deletions jouent dans la differentiation 
phenotypique du complexe tuberculeux. 

Enfin, les inventeurs ont mis en evidence, toujours par la 
comparaison du BAC de M tuberculosis H37Rv et du BAC de M bovis 
BCG deux duplications dans le genome de M bovis BCG-Pasteur, appelees 
DU1 et DU2. II s'agit de duplications de regions de plusieurs dizaines de 
kilobases qui semblent etre absentes a la fois de la souche type de M bovis 
et deM tuberculosis H37Rv. La mise en evidence de ces deux duplications 
a ete faite suite a une digestion des memes clones pour chaque BAC avec 
Hindlll et une analyse sur gel d'electrophorese en champ pulse (PFGE). 
Ces observations ont ete confirmees par hybridation de l'ADN 
chromosomique digere issu deM bovis BCG, de la souche type deM bovis 
et M tuberculosis H37Rv avec des sondes selectionnees couvrant les 
regions dupliquees. Des amorces specifiques pour les regions rearrangees 
ont ete preparees et testees sur l'ADN genomique a partir d'isolats 
additionnels deM bovis BCG etM. tuberculosis. 

II a ete determine que DU1 et DU2 etaient presentes chez trois 
souches deM bovis BCG y compris chez M bovis BCG-Pasteur et absentes 
de trois autres sous-souches deM bovis BCG. 

Ces deux duplications sont egalement absentes de la souche type 
deM bovis et deM tuberculosis H37Rv. 

Ainsi, toujours dans le cadre de la presente invention relativement 
a la detection discriminante de M bovis ou M tuberculosis, Tinvention a 
egalement pour objet un procede de detection et d'identification 
discriminante de M bovis BCG ou M tuberculosis dans un echantillon 
biologique comprenant les etapes suivantes : 
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la digestion par une enzyme de restriction d'au moins une partie du 
genome de la mycobacterie presente dans I'echantillon biologique a 
analyser, et 

- Panalyse des fragments de restriction ainsi obtenus. 

5 La digestion par une enzyme de restriction peut en efFet etre 

realisee soit sur I'integralite du genome de la mycobacterie, soit sur un ou 
plusieurs clones de la banque realisee a partir du genome en question. 

Preferentiellement, Tenzyme de restriction utilisee dans le cadre du 
susdit procede est HindJTL. 

10 En ce qui concerne P analyse des fragments de restriction, celle-ci 

peut consister a compter lesdits fragments et/ou a determiner leur longueur. 
En efFet, comme ceci est explique ci-apres, la digestion par Hindll! de M. 
bovis BCG donne lieu a un fragment de plus que ceux obtenus apres 
digestion par Hindlll du genome deM tuberculosis H37Rv. Le nombre des 

15 fragments ainsi obtenus peut egalement etre complete par la determination 
de leur longueur. Ceci peut etre realise au moyen de techniques bien 
connues de Thomme du metier, par exemple sur un gel d'electrophorese en 
champ pulse (PFGE). II a ainsi pu etre determine que le fragment 
supplemental apparaissant apres digestion par Hindlll du genome de M 

20 bovis BCG-Pasteur presentait une taille d'environ 29 kb. 

Une autre fa9pn d* analyser les fragments de restriction resultant de 
la digestion enzymatique du genome de la mycobacterie telle que ci-dessus 
decrite, consiste a mettre en contact lesdits fragments avec au moins une 
sonde appropriee, couvrant par exemple la region dupliquee, dans des 

25 conditions d'hybridation afin d' identifier ensuite le nombre et la taille des 
fragments qui ont hybride. Les sondes utilisees a cette fin peuvent etre 
marquees ou non marquees selon les techniques bien connues de Fhomme 
du metier. 
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Ainsi, la sonde peut etre obtenue par amplification de l'ADN 
genomique avec les amorces choisies dans le groupe SEQ ID N° 31, SEQ 
ID N° 32, SEQ ID N° 33 OU SEQ ID N° 34 avec le couple : 

- SEQIDN o 31/SEQn>N 0 32 Sp ecifiquedeDUl 
5 - SEQIDN°33/SEQIDN 0 34 S pecifiquedeDU2 

On peut aussi analyser les fragments en effectuant une 
amplification des fragments obtenus avec des amorces choisies dans le 
groupe SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N* 22, SEQ 
ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27 et 
10 SEQ ID N° 28 avec : 

- SEQ ID N* 19, SEQ ID N° 20 / SEQ ID N° 21 specifiques de 
JDUl 

- SEQ JDN° 22, SEQ ID N° 24 / SEQ ID N° 23, SEQ ID N° 25 
specifiques de JDU2A 

- SEQ IDN ° 26 / SEQ ID N° 27, SEQ ID N° 28 specifiques de 
JDU2B 

Enfin, on peut egalement amplifier les fragments obtenus avec des 
amorces choisies dans le groupe SEQ ID N° 35, SEQ ED N° 36, SEQ ID N° 
37 et SEQ ID N° 38 specifiques de DU1 puis les analyser par sequencage. 



15 



20 



25 



30 



LEGENDES DES FIGURES 

FIGURES 1A a ID : Carte du BAC de Mycobacterium bovis 
BCG Pasteur superposee au BAC de M tuberculosis H37Rv et aux cartes 
de cosmide (ces figures doivent se lire de gauche a droite et de haut en bas, 
la figure 1 A en haut a gauche, la figure IB en haut a droite, la figure 1C en 
bas a gauche et la figure ID en bas a droite). 

Les clones «X » correspondent aux clones dans pBeloBACll de M 
bovis BCG, les clones « XE » correspondent aux clones dans P BACe3.6 deM 
bovis BCG, les clones « Rv » correspondent aux clones dans pBeloBACll de 
M tuberculosis, les clones « Y» correspondent aux clones dans le cosmide 
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pYUB328 de M tuberculosis et les clones « I » correspondent aux clones 
dans le cosmide pYUB412 de M. tuberculosis. La localisation de chaque 
region de deletion est montree sur la carte. Les barres d'echelle indiquent la 
position sur le genome de M tuberculosis. 
5 FIGURES 2A a 2F : Vue generate des regions deletees RD5- 

RD10. 

Les regions deletees a partir du genome de M tuberculosis sont 
delimitees par des fleches avec une sequence flanquant chaque deletion. Les 
ORF (cadres ouverts de lecture) sont representes par des boites « dirigees » 
10 montrant le sens de la transcription comme precedemment decrit (Cole et 
al., 1998). Les fonctions putatives et les families des ORF sont decrites dans 
le Tableau 3. Les codons stop sont indiques par de petites barres verticales. 
FIGURE 3 : Detection de la deletion RD5. 

Des digestions du clone Rvl43 du BAC avec les endonucleases 
15 EcoRl, Pstl et Stul ont revele que des fragments de 1,5 kb (EcoRI), 1,5 kb 
(PstI), 1,3 et 2,7 kb (Stul) ne montraient aucune liaison avec des sondes 
d'ADN de M bovis ou de M. bovis BCG (les bandes manquantes sont 
indiquees par des fleches). La taille en kilobases (kb) est indiquee sur la 
gauche. 

20 FIGURE 4 : Les regions RvDl et RvD2. 

A. Polymorphisme de taille dans des amplicons generes par des 
amorces flanquant (i) RvDl et (ii) RvD2. Des reactions de PCR ont ete 
realisees au moyen du kit GeneAmp XL PCR (Perkin Elmer) avec des 
matrices d'ADN de M tuberculosis H37Rv, M bovis et M bovis BCG 

25 Pasteur en combinaison avec des amorces decrites dans le Tableau 3. La 
taille en kilobases est indiquee a gauche de chaque image. 

B. Structure des ORF des loci de RvDl et RvD2. La sequence des 
deux loci a ete determinee a partir de M bovis BCG Pasteur, la sequence 
flanquante dans M tuberculosis H37Rv etant montree. Les fonctions 



>OCIO: <WO OOS5382A1_l_> 



22 



putatives des ORF sont decrites dans le Tableau 1 avec des barres verticales 
representant les codons stop. 

FIGURE 5 : Region dupliquee DU1 dans M bovis BCG-Pasteur 
comparativement a la meme region dansM tuberculosis H37Rv 

FIGURE 6 : Region dupliquee DU2 dans M bovis BCG-Pasteur 
comparativement a la meme region dansM tuberculosis H37Rv 

La presente demande ne se limite pas a la description ci-dessus et 
sera mieux comprise a la lumiere des exemples ci-apres qui ne doivent en 
aucune maniere etre consideres comme limitant la presente invention. 

EXEMPLES 

L PROCEDURES ET RESULTATS 

Construction d'une banaue BAC deM bovis BCG-Pasteur 
Des tentatives precedentes pour doner des inserts tres larges 
d'ADN mycobacteriens (120-180 kb) dans le vecteur pBeloACll se sont 
soldees par un echec (Brosch et al., 1998). Pour etablir si cette 
determination de taille etait due au vecteur pBeloBACl 1, les inventeurs ont 
teste en parallele le vecteur pBACe3.6 de BAC qui utilise le systeme de 
selection sacB (Lawes et Maloy, 1995 ; Pelicic et al., 1996). Des ligatures 
realisees avec des fragments dans des gammes de taille de 50-125 kb ont 
donne 5 a 10 fois moins de transformants dans pBACe3.6 que les ligatures 
controle utilisant pBeloBACll (clones X). La taille d'un insert dans les 
clones pBACe3.6 etait approximativement comprise dans l'intervalle 40- 
100 kb, similaire a ce qui avait ete observe pour pBeloBACl 1. Ceci suggere 
qu'une taille d' environ 120 kb est bien la taille limite superieure pour la 
faisabilite du clonage d'ADN mycobacterien. 
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Definition du ieu minimum des BACs de BCG 
100 clones selectionnes au hasard a partir des banques de 
pBeloBACll et de pBACe3.6 ont ete sequences aux extremites pour 
determiner leur position par rapport au chromosome de M. tuberculosis 

5 H37Rv (Cole et al., 1998). Ceci a donne un reseau minimum de clones sur 
le genome mais avec un groupement preferentiel au voisinage de Punique 
operon rm, ce qui a egalement ete observe durant la construction de la carte 
du BAC de M. tuberculosis (Brosch et al., 1998). Pour combler les trous 
entre les clones positionnes, des amorces de PCR ont ete elaborees, sur la 

10 base de la sequence du genome complet de M tuberculosis, de fa<?on a 
cribler des pools de BAC pour des clones specifiques. En utilisant cette 
methodologie, des clones couvrant plus de 98 % du genome ont ete isoles et 
positionnes sur la sequence du genome de M tuberculosis. 

Un jeu minimum de 57 clones de BAC de M. bovis BCG a ete 

15 necessaire pour couvrir le genome (Figure 1). 56 de ces clones proviennent 
de la banque pBeloBACll et 1 provient de la banque de pBACe3.6, a 
savoir XE015 (a environ 680 kb). Du fait que des experiences anterieures 
avaient montre que les clones de M. tuberculosis bases sur pBeloBACll 
presentaient une exceptionnelle stabilite (Brosch et al., 1998), ces clones ont 

20 ete preferes au systeme pBACe3.6 moins caracterise. Le clone XE015 
represente une region pour laquelle les clones de pBeloBACl 1 ne pouvaient 
pas etre trouves. Deux zones d' environ 36-52 kb, couvertes par aucun 
clone, sont localisees a environ 2 660 kb et environ 2 960 kb sur le genome. 
Precedemment, Fisolement de cosmides et de clones de BAC de 

25 M tuberculosis qui couvraient la region a environ 2 960 kb a pose des 
problemes (Brosch et al., 1998) suggerant que cette region pourrait contenir 
des genes qui sont prejudiciables a E. coli. 
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Utilisation des puces B AC pour detecter des deletions dans \* 
genome deM bovis BCG 

II s'agit de la mise en evidence, a partir de la banque de BAC de 
M tuberculosis H37Rv, de 63 clones couvrant 97 % du genome (Brosch et 
al. f 1998). L'analyse in silico de la sequence du genome de M tuberculosis 
a revele que la digestion de ces clones avec soit PvwII ou EcoRI donnait lieu 
a un nombre raisonnable de fragments de restriction pour chaque clone. Les 
fragments digeres ont migre a travers des gels d'agarose, ont donne lieu a 
des spots sur des membranes et ont ensuite ete hybrides avec de l'ADN 
genomique marque au 32 P de M bovis BCG et M bovis. Les fragments de 
restriction qui n'ont pas hybride avec les sondes d'ADN ont ete consideres 
comme manquant dans les genomes de M bovis ou BCG. Comme le 
criblage initial n'employait que deux enzymes, il est possible que d'autres 
deletions soient passees inaperpues. Cependant, il est probable que toutes 
les deletions importantes (> 5 kb) ont ete detectees par cette approche. 

A partir d'une analyse de l'ensemble du genome, 10 loci ont ete 
identifies qui semblent etre absents dans M. bovis BCG par rapport a 
M tuberculosis. Des hybridations avec l'ADN genomique de M. bovis ont 
revele que 7 de ces loci etaient egalement deletes dans M. bovis par rapport 
a M tuberculosis. Une analyse plus serree a revele que les trois deletions 
specifiques de M bovis BCG etaient identiques aux regions RD1-RD3 
defmies par Fequipe de Stover (Mahairas et al., 1996). En gardant la 
precedente nomenclature, les 7 deletions M bovis I BCG ont ete designees 
RD4, RD5, RD6, RD7, RD8, RD9 et RD10 (Figures 1 et 2). Les reactions 
de sequen<?age utilisant les clones de BAC correspondant en tant que 
matrice ont ete utilisees pour definir precisement les zones terminales des 
deletions (Figure 2, Tableau 1). 
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RD4 

RD4 est une deletion de 12,7 kb precedemment caracterisee 
comme une region absente de M bovis et M. bovis BCG des sous-souches 
Pasteur, Glaxo et Danemark (Brosch et al., 1998). Parmi les proteines 
codees par les 11 ORFs, certaines montrent des ressemblances avec des 
enzymes impliquees dans la synthese des lipopolysaccharides. Pour 
determiner si RD4 etait deletee seulement dans les souches bovines, M. 
qfricanum, M microti, M. tuberculosis CSU#93 et 27 isolats cliniques de 
M tuberculosis ont ete examines pour la presence du locus (Tableau 2). Des 
reactions de PCR utilisant des amorces internes a RD4 (Tableau 3) n'ont 
genere que des produits dans des souches non bovines. 

RD5 

RD5 a une taille de 8 964 pb localisees entre les positions 
15 genomiques 2626067-2635031 (Figure 3, Tableau 1). La region contenait 8 
ORFs (Tableau 1), trois d'entre elles : plcA, plcB et plcC, codent pour des 
enzymes de phospholipase C tandis que deux autres codent pour des 
proteines appartenant respectivement aux families de ESAT-6 et QILSS 
(Cole et al., 1998 ; F. Tekaia, S. Gordon, T. Gamier, R. Brosch, B.G. 
20 Barrell et S.T. Cole, soumis). L'ORF Rv2352c code pour une proteine PPE 
qui est un membre de la grande famille des proteines dans M. tuberculosis 
(Cole et al., 1998). Une autre proteine de la famille de PPE (Rv2352c) est 
tronquee dans M bovis BCG du fait que Tune des deletions des parties 
terminales est situee dans l'ORF. Des recherches dans les bases de donnees 
25 ont revele qu'un segment de 3 013 pb de RD5 etait virtuellement identique 
au locus mpt40 precedemment decrit, montre par Pattaroyo et al. comme 
etant absent chez M bovis et M bovis BCG (Leao et al., 1995). Des 
amorces destinees a amplifier la partie interne de RD5 (Tableau 3) ont ete 
utilisees dans des reactions de PCR avec de PADN issu de bacilles 
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tuberculeux varies. Aucun amplicon n'a ete produit a partir des matrices de 
M. bovis, M. bovis BCG et M. microti (Tableau 2) indiquant que M iwcro// 
est egalement depourvu du locus RD5. 

5 RD6 

RD6 a ete cartographiee au niveau de la sequence d'insertion 
ISJ532, un element IS qui est manquant chez M. microti, M bovis et 
M. bovis BCG (Gordon et al., 1998) (Tableau 1). La delimitation de la taille 
de la deletion a ete compliquee par la presence de regions repetees 
10 flanquant directement Telement IS et necessitant l'utilisation d'amorces en 
dehors de la region repetee (Tableau 3). Ces amorces ont amplifies des 
produits chezM bovis etM bovis BCG qui sont plus petits d'environ 5 kb 
que 1'amplicon de M. tuberculosis. La marche a 1'aide d'amorce a ete 
utilisee pour localiser precisement les jonctions de deletions et a revele une 
deletion de 4 928 b chez M bovis et M bovis BCG (position genomique de 
M. tuberculosis 3846807-3841879). A l'instar de l'element IS/552, il a ete 
determine que RD6 contenait deux genes codant pour des proteines PPE 
(Rv3425 et Rv3426) et une partie de Rv3424c dont la fonction est inconnue 
(Tableau 1). 



15 



20 



RD7 

La deletion RD2 decrite dans Mahairas et al. (Mahairas et al., 
1996) a ete cartographiee dans le clone Rv420 de M tuberculosis et les 
resultats obtenus par les inventeurs ont suggere l'existence d'une deletion 
25 supplemental chez M. bovis BCG tres proche de RD2. Des hybridations 
ont ete repetees utilisant de PADN genomique de M. bovis en tant que 
sonde puisque cette souche contient des sequences RD2, simplifiant ainsi 
Tidentification d'autres fragments deletes. Cette analyse (Figure 2) a revele 
une deletion de 1 2 7 1 8 pb chez M bovis BCG par rapport a M. tuberculosis, 
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localisee 336 pb en amont de RD2, aux positions 2208003-2220721 sur le 
genome deM. tuberculosis. La region RD7 contient 14 ORFs (Tableau 3). 8 
d'entre eux (Rvl 964-1 971) constituent une partie de I'operon avec le gene 
putatif d'invasine mce3 (Cole et al., 1998). Les ORFs Rvl 968, Rvl 969, 
5 Rvl971, Rvl973 et Rvl975 pourraient coder pour d'eventuelles proteines 
exportees ou exprimees a la surface puisqu'ils contiennent des sequences 
signal N-terminales putatives ou des ancrages membranaires. Elles sont 
toutes membres de la famille Mce et ont des proprietes communes (Tekaia 
et al., soumis). De fa<?on interessante, Mce3 et Rvl 968 contiennent le 

10 tripeptide « RGD » ou Arg-Gly-Asp, un motif implique dans l'attachement 
cellulaire (Ohno, 1995 ; Relman et al., 1989). Rvl 977, qui est tronque par 
RD7, code pour une proteine presentant des similarites (38,5 % d'identite 
sur 275 acides amines) avec un polypeptide hypothetique et la souche PCC 
6803 de Synechocystis. Une analyse PCR (Tableau 2) a revele que RD7 

15 etait present dans 30 isolats cliniques de M tuberculosis ainsi que dans M 
africanum et M tuberculosis CSU#93. Le locus etait cependant absent de 
M. microti, M bovis et M. bovis BCG. 

RD8 

20 RD8 englobe une region de 5 895 pb positionnee sur la sequence 

genomique de M tuberculosis a 4556836-4062731. La deletion contient 6 
ORFs (Figure 2, Tableau 1) avec un septieme ORF : IpqQ qui code pour 
une lipoproteine tronquee a son extremite 5' par la deletion. Parmi ces 6 
ORFs, Rv3619c et Rv3620c codent pour des membres des families de 

25 ESAT-6 et QILSS (Cole et al., 1998, Harboe et al., 1996 ; F. Tekaia, et al., 
soumis) et 2 autres ORFs codent pour des proteines PE et PPE. Les 2 autres 
ORFs, ephA et Rv3618, codent respectivement pour une hydrolase epoxyde 
putative et une monooxygenase. L' analyse PCR dirigee contre un segment 
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interne de RD8 (Tableau 2) a revele que la region etait egalement deletee 
chez le type sauvage de hi. bovis et M. microti. 

RD9 et RD10 

La deletion de 2 030 pb englobee par RD9 couvre 2 ORFs, 
Rv2037c et Rv2074, qui codent vraisemblablement respectivement pour 
une oxydoreductase et une proteine inconnue (Tableau 1). 2 ORFs 
additionnels sont tronques par RD9 : Rv2075c code pour une proteine 
exportee putative tandis que cobL code pour une methyltransferase 
precorrine impliquee dans la synthese de la cobalamine. L'analyse PCR 
avec des amorces flanquantes (Tableau 3) a revele que RD9 est egalement 
present chezM africanum etM microti (Tableau 2). RD10 est une deletion 
de 1 903 pb qui tronque 2 ORFs, echAl et Rv0223, qui codent une enoyl 
CoA hydratase et une aldehyde dehydrogenase respectivement (Tableau 1). 
Des reactions de PCR ont revele que RD10 etait absent chez M. microti 
ainsi que chezM bovis et BCG. 

D'autres differences entreM tuberculosis et BCG 
Compte tenu du fait que les genomes des bacilles tuberculeux sont 
hautement conserves (Sreevatsan et al., 1997), la comparaison locale directe 
peut etre entreprise d'une facon simple et ciblee en examinant les profils 
d'enzyme de restriction generes a partir des clones de BAC de 
M. tuberculosis et M. bovis BCG qui couvrent les memes regions. Une 
cartographie comparative de la zone englobee par le clone X318 a identifie 
cette zone comme etant tres differente des clones correspondants de 
M. tuberculosis. Les donnees relatives aux sequences terminales a partir du 
clone X066 ont revele que si sa sequence terminate SP6 permettait de le 
positionner a environ 2 380 kb sur la matrice de M tuberculosis, la 
sequence terminale T7 ne generait aucune similarite significative avec une 
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quelconque sequence de H37Rv, indiquant qu'une extremite de X066 etait 
interne au segment d'ADN present dans BCG mais absent de H37Rv. Des 
amorces de sequen<?age ont ete utilisees pour marcher le long du clone 
X318 du BAC de BCG (Figure 1) et ont revele T insertion a la position 
2238724 pb dans le genome deM tuberculosis. Utilisees dans des reactions 
PCR, les matrices de M. bovis BCG et M bovis ont genere des amplicons 
plus grands d'environ 5 kb que le produit deM tuberculosis H37Rv (Figure 
4A). L'insert entier, designe RvDl, a ete sequence a partir de X318 BCG. 
L'insert de 5 014 pb prolongait I'ORF, Rv2024c deM tuberculosis de 2,8 
kb et contenait un ORF additionnel, RvDl-ORF2, de 954 pb (Tableau 1, 
Figure 4B). RvDl-ORFl se superpose au point de jonction 5' de la deletion 
et s'etend a 1'interieur du DNA flanquant. L'analyse FASTA a revele que 
RvDl-ORFl et FORF2 codent pour des proteines ne presentant aucune 
similarite significative avec d'autres proteines dans les bases de donnees. 
Rv2024c etendu a montre certaines similarites (36,5 % d'identite sur 946 
acides amines) avec une proteine hypothetique ^Helicobacter pylori (n° 
d'accession 025380). La perte de cette sequence n'a clairement aucune 
consequence sur la virulence de M tuberculosis H37Rv puisque cette 
souche est pleinement virulente chez les modeles animaux. Une analyse 
PCR specifique du locus a demontre sa presence dans plusieurs mais pas 
dans tous les isolats cliniques ainsi que dans toutes les souches BCG testees 
(Tableau 2). 

Un ORF codant pour une phopholipase, plcD y est interrompu par 
IS6JJ0 dansM tuberculosis H37Rv (Cole et al., 1998). Pour determiner si 
plcD etait intact dans d'autres membres du complexe tuberculeux, des 
amorces qui flanquaient le site d'insertion IS6110 (Tableau 3) ont ete 
utilisees dans des reactions de PCR avec M. bovis, M. bovis BCG et 
M. tuberculosis H37Rv. Ceci a revele un polymorphisme au locus plcD ou 
les amplicons de M. bovis et de M bovis BCG etaient d'environ 5 kb plus 
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grands que le produit de H37Rv (Figure 4A). Cette deletion d'environ 5 kb 
dans le genome de M tuberculosis H37Rv par rapport a M bovis BCG a ete 
appelee RvD2. Le sequen?age du clone X086 du BAC de M. bovis BCG a 
revele que RvD2 etait positionne entre les bases 1987699-19890045 dans le 
genome de M. tuberculosis. La region eomprend 6,5 kb et contient 3 ORFs 
codant pour une proteine inconnue, une oxydoreductase et une proteine 
membranaire, et elle prolonge le gene plcD pour coder pour un produit de 
514 acides amines (Figure 4B, Tableau 1). 

II. DONNES EXPEREMENTALES 

Souches bacteriennes et plasmides 

Les souches du complexe de M. tuberculosis 
{Mycobacterium africanum, Mycobacterium microti, Mycobacterium 
tuberculosis, Mycobacterium bovis et Mycobacterium bovis BCG) et sous- 
souches de M bovis BCG (Danemark, Glaxo, Russe, Japonais, Pasteur et 
Moreau) ont ete obtenus a partir des stocks de laboratoires (Unite de 
G.M.B., Institut Pasteur). Mycobacterium tuberculosis CSU#93 a ete re?u 
de John BELISLE, Department of Microbiology, Colorado State University, 
Fort Collins, CO 80523. Des isolats cliniques non epidemiques de 
M. tuberculosis ont ete fournis par Beate HEYM, Hopital Ambroise Pare, 
9 avenue Charles de Gaulle, 92104 BOULOGNE CEDEX, FRANCE. Les 
vecteurs de BAC pBeloBACll (Kim et al., 1996) et PBACe3.6 (Genbank 
n° d'accession U80929) ont ete donnes par H. SHIZUYA, Department of 
Biology, California Institute of Technology, Pasadena, CA, et P. de JONG, 
Roswell Park Cancer Institute, Human Genetics Department, Buffalo, NY, 
respectivement. Les vecteurs et les recombinants derives ont ete maintenus 
dans£. co// DH10B. 
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Preparation de V ADN genomique 

La preparation de l'ADN genomique dans des cubes d'agarose a 
partir deM bovis BCG Pasteur a ete realisee comme indique precedemment 
(Philipp et al., 1996 ; Philipp et al., 1996) mais avec deux digestions a la 
5 proteinase K pendant 24 h chacune, plutot qu'une digestion de 48 h. Les 
cubes ont ete stockes dans 0,2 M EDTA a 4°C et laves 2 fois dans 50 ml de 
Tris-EDTA (pH 8)/Triton X-100 (0,1 %) a 4°C pendant 1 h, ensuite laves 2 
fois dans 50 ml d'un tampon d'enzyme de restriction Triton X-100 (0,1 %) 
pendant 1 h a temperature ambiante avant utilisation. 

10 

Construction de la banque BAC 

Un vecteur d'ADN a ete prepare comme precedemment indique 
(Woo et al, 1994). Des digestions partielles avec HindHI et EcoRI de 
1'ADN dans l'agarose, pour le clonage dans pBeloBACll et pBACe3.6 

15 respectivement, et ensuite une migration en champ electrique homogene a 
contour serre (CHEF) ont ete realisees comme precedemment decrit 
(Brosch et al., 1998). 5 zones, 50-75 kb, 75-100 kb, 100-125 kb, 125-150 kb 
et 150-170 kb ont ete excisees a partir des gels d'agarose et stockees dans 
duTEa 4°C. Des ligatures avec les vecteurs pBeloBACl 1 et pBACe3.6 et 

20 une transformation dans E. coli DH10B ont ete realisees comme 
precedemment decrit (Brosch et al., 1998). Les transformants pBeloBACll 
ont ete selectionnes sur de Tagar LB contenant 12,5 |Xg/ml de 
chloramphenicol, 50 |ig/ml de X-gal et 25 ^g/ml d'IPTG, et ont ete cribles 
avec des colonies recombinantes blanches. Les transformants pBACe3.6 ont 

25 ete selectionnes sur de Tagar LB contenant 12,5 ^g/ml de chloramphenicol 
et 5 % de sucrose. Les clones recombinants ont ete repiques, en deux 
exemplaires, dans des plaques microtitre a 96 puits contenant un milieu 
2xYT avec 12,5 |ig/ml de chloramphenicol et ont ete incubes toute la nuit a 
37°C. Un volume egai de glycerol a 80% a alors ete ajoute aux puits et une 
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plaque a ete conservee a -80°C en tant que plaque maitresse. La plaque 
restante a ete utilisee pour faire des ensembles de clones a des fins de 
criblage (voir ci-dessus). 

5 Preparation d' ADN a partir de recombinants et determination de la 

taille des inserts 

Un recombinant portant un plasmide d'ADN a ete prepare a partir 
de 40 ml de culture et a ete mis en croissance sur le milieu 2xYT contenant 
12,5 |ag/ml de chloramphenicol comme precedemment decrit (Brosch et aL, 

10 1998). 100-200 ng d'ADN ont ete digeres avec Dral (Gibco-BRL) et les 
produits de restriction ont ete separes sur un gel d'electrophorese en champ 
pulse (PFGE) avec un appareil CHEF de LKB-Pharmacia utilisant un gel 
d 5 agarose a 1 % (poids/volume) et une impulsion de 4 secondes pendant 
15 h a 6,25 V/cm. Des marqueurs PFGE de taille moyenne et inferieure 

15 (New England Biolabs) ont ete utilises en tant que taille standard. Les tallies 
des inserts ont ete estimees apres coloration au bromure d'ethidium et 
visualisation avec de la lumiere UV. 

Reactions de sequenyage 

20 Des reactions de sequenfage ont ete realisees comme 

precedemment indique (Brosch et al., 1998). Pour des clones isoles a partir 
de la banque de pBeloBACl 1, les amorces SP6 et T7 ont ete utilisees pour 
sequencer les extremites des inserts, tandis que pour les clones pBACe3.6, 
les amorces derivees du vecteur ont ete utilisees. Les reactions ont ete 

25 chargees sur des gels de polyacrylamide a 6 % et une electrophorese a ete 
realisee avec un sequenceur d'ADN automatique 373A ou 377 (Applied 
Biosystems) pendant 10 a 12 h. Les reactions ont donne generalement entre 
300 et 600 pb de sequences lisibles. 
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Puces BAC 

Les clones qui se superposaient a partir de la banque pBeloBACl 1 
deM tuberculosis H37Rv (Brosch et al., 1998) ont ete selectionnes de telle 
fa?on que 97 % du genome de M tuberculosis etaient representes. L' ADN 

5 prepare a partir de ces clones a ete digere avec EcoBJ (Gibco-BRL) ou 
Pvull (Gibco-BRL) et a ete mis a migrer dans des gels d'agarose a 0,8 %, 
de 25 cm de longueur, a un faible voltage pendant 12 a 16 h. Apres 
coloration et visualisation aux UV, les gels d'agarose ont ete traites avec la 
methode Southern standard et les ADN ont ete transferes sur des 

10 membranes de nitrocellulose Hybond-C Extra (Amersham). L'ADN a ete 
fixe a la membrane par chauffage a 80°C pendant 2 h. L'ADN genomique 
deM tuberculosis H37Rv, Mycobacterium bovis ATCC 19210 et M bovis 
BCG Pasteur a ete marque avec [a- 32 P]dCTP au moyen du kit Prime-It II 
(Stratagene). Les sondes ont ete purifiees a travers une colonne P10 

15 (Biorad) avant utilisation. Des hybridations ont ete realisees comme 
precedemment decrit (Philipp et al., 1996). Les sondes marquees purifiees 
ont ete mises en solution dans une solution de 5xSSC (lxSSC est 0,5 M de 
chlorure de sodium ; 0,015 M de citrate de sodium), et 
50 % (poids/volume) formamide. L'hybridation a ete realisee a 37°C, et les 

20 membranes ont ete lavees pendant 15 mn a temperature ambiante dans du 
2xSSC/0,l % SDS et ensuite dans du lxSSC/0,1 % SDS et finalement dans 
du 0,lxSSC/0,l % SDS. Les resultats ont ete interprets a partir des 
autoradiogrammes. En general, il a ete difficile de visualiser sur les 
autoradiogrammes les fragments de moins de 1 kb, surtout apres utilisation 

25 repetee des membranes. Les fragments superieurs a 1 kb ont donne des 
resultats plus clairs. Les clones qui sont apparus comme contenant des 
fragments sans contrepartie dans M. bovis BCG ont ete repiques pour des 
analyses ulterieures. La sequence genomique a permis Tetablissement de 
cartes de restriction dans le but de determiner les zones de deletion 
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suspectees, permettant de selectionner des enzymes dormant la meilleure 
resolution des regions. Des clones pouvaient ainsi etre digeres avec une 
seconde gamme d' enzymes (generalement Pstl et Stul, avec EcdRl inclus 
en tant que controle) et hybrides pour obtenir une taille plus precise de la 
deletion. Les amorces de sequen?age qui flanquent les deletions ont ainsi 
ete designees et utilisees dans les reactions de sequen?age avec le BAG 
correspondant deM bovis BCG utilise comme matrice. 

Analyses PCR 

Les amorces utilisees dans les reactions de PCR sont listees dans 
les Tableaux 3 et 4. Les reactions pour des produits attendus de moins de 3 
kb ont ete realisees avec une polymerase Taq standard (Boehringer 
Mannheim). Les reactions mettaient en oeuvre 5 jj.1 de tampon lOxPCR (100 
mM de P-mercaptoethanol, 600 mM de Tris HC1, pH 8,8), 20 mM de 
MgCl 2 , 170 mM de (NKO2SO4, 5 \il de melange nucleotidique a 20 mM, 
0,2 11M de chaque amorce, 10-50 ng de matrice d'ADN, du DMSO a 10 %, 
0,5 unite de polymerase Taq et de Teau distillee sterile a 50 jil. Les cycles 
thermiques ont ete realises avec un amplificateur PTC-100 (MJ Inc.) avec 
une etape de denaturation initiale de 90 secondes a 95°C suivie par 35 
cycles de 30 secondes a 95°C, 1 min a 55°C et 2 min a 72°C. 

Les reactions de PCR susceptibles de donner lieu a des produits 
superieurs a 3 kb ont ete realisees au moyen du kit de PCR GeneAmp XL 
(Perkin Elmer). Les reactions ont ete lancees selon les instructions des 
fabricants, avec 0,8 mM de Mg(OAc) 2 , 0,2 |iM de chaque amorce et 
10-30 ng de matrice d'ADN par reaction. Les cycles thermiques etaient 
realises a 96°C pendant 1 mn, suivis ensuite par 15 cycles en 2 etapes a 
94°C pendant 15 secondes et 70°C pendant 7 mn, suivis par 20 cycles en 2 
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etapes a 94°C pendant 15 secondes et 70°C pendant 8 mn plus 15 secondes 
par cycle. 

Analyse informatique 

5 Les donnees concernant les sequences ont ete transferees du 

sequenceur automatise ABI373A aux stations de travail Digital ou Sun et 
editees au moyen du logiciel TED a partir de Fensemble Staden. Les 
sequences editees ont ete comparees a la base de donnees des inventeurs 
concernant M tuberculosis (H37Rv.dbs) pour determiner les positions 

10 relatives des sequences terminal es sur la sequence du genome de 
M. tuberculosis. Avec cette methode, une cartographie des clones BAC de 
M bovis BCG a ete construite en utilisant la sequence de M tuberculosis 
H37Rv comme matrice. 

Pour faire de la comparaison genomique, des digestions in silico au 

15 moyen d'enzymes de restriction ont ete realisees avec le logiciel NIP 
(Nucleotide Interpretation Program) a partir de T ensemble Staden. Le 
programme Display and Analysis (DIANA) du Centre Sanger, Cambridge, 
UK, a ete utilise pour interpreter les donnees de sequence. 

20 Numeros d'accession des sequences d* ADN 

Les sequences nucleotidiques qui flanquent chaque locus RD dans 
M. bovis BCG ont ete deposees dans la base de donnees EMBL. Les 
numeros d'accession pour RD5, RD6, RD7, RD8, RD9 et RD10 sont 
respectivement AJ007300, AJ131209, AJ007301, AJ131210, Y181604 et 

25 AJ1 32559. Les sequences de RvDl et RvD2 dans M. bovis BCG ont ete 
deposees sous les n° Y 18605 et U 18606 respectivement. 
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Mise en evidence de la region dupliquee DU1 

DU1 a ete la premiere region dupliquee observee quand les bandes 
de digestion par Hindlll du clone X038 du BAC de BCG et du clone Rvl3 
du BAC de H37Rv ont ete comparees. Les deux clones X038 et Rvl3 
5 avaient des sequences terminales identiques, s'etendant de la position 
Hindlll ~ 4 367 kb au site Hindlll ~ 0 027 kb (via 4411529 b) sur la 
sequence du genome de M tuberculosis H37Rv (MTBH37RV), englobant 
Porigine de replication. 

L'analyse in silico des sites de restriction Hindlll pour la zone 

10 donnee entre ~ 4 367 kb et ~ 0 027 kb a revele un site Hindlll a la position 
-4 404 kb. En consequence, la digestion de ces clones devrait montrer deux 
fragments de restriction plus la bande specifique du vecteur a environ 8 kb. 
C'etait le cas pour le clone Rvl3 de H37Rv. Au contraire, le clone X038 du 
BAC de BCG montrait trois bandes plus la bande specifique du vecteur a 

15 environ 8 kb, deux d'entre elles etaient identiques au schema de Rvl3. La 
bande additionnelle presente une taille d'environ 29 kb. Des analyses PFGE 
supplementaires utilisant Dral ont revele que X038 est bien de 29 kb plus 
long que Rvl3. Par un criblage PCR des pools de BAC de BCG utilisant 
des oligonucleotides selectionnes, les inventeurs ont pu identifier trois 

20 clones X de plus couvrant les parties de cette region genomique dans BCG : 
X585, X592, X703. La sequence terminate et l'analyse PFGE ont montre 
que chacun de ces clones contient un insert de taille differente, 
correspondant aux trois bandes observees dans les resultats de digestion de 
X038 (Figure 5). 

25 

Les sequences terminales sont : X585 (~ 4 367-4 404 kb) ; X592 (~ 
4 404-4404 kb) ; X703 (~ 4 404-0 027 kb). Les sequences ont ete repetees 
deux fois avec les memes resultats. Le curieux resultat selon lequel le clone 
X592 a des extremites T7 et SP6 dans la meme region genomique pouvait 
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etre explique par une duplication de cette region genomique dans BCG et a 
donne egalement F indication sur la dimension du rearrangement. Des 
analyses de restriction comparatives additionnelles des clones X585, X592, 
X703 et X038 avec EcoRl ont revele que X592 et X703 ont le meme 

5 schema de restriction a F exception d'une bande de 10 kb presente dans 
X703 mais absente de X592. Sur la base de ces resultats, des amorces ont 
ete preparees pour F amplification de la region de jonction ou le segment 
d' ADN duplique joint Funique region. 

L'analyse PCR avec des amorces a 16.000 et a 4398.700 pb (SEQ 

10 ID N° 19 et 21) a donne un produit d'une taille attendue a partir du clone 
X592 et egalement sur FADN genomique de BCG-Pasteur. Le sequenfage 
des produits PCR obtenus directement sur FADN de BAC du clone X592 a 
revele que la jonction etait bien localisee aux bases 16,732/4398,593 
comparativement a la sequence genomique de H37Rv et que ce 

15 rearrangement genomique resultait en la troncature des genes Rv3910 et 
pknB. Toutefois, dans la mesure ou ce rearrangement est une duplication en 
tandem, des copies intactes des deux genes pouvaient etre presentes dans les 
regions avoisinantes. L' analyse PCR avec des amorces franqiiantes des 
genes Rv3920 et pknB a confirme ceci quand FADN genomique du BCG- 

20 Pasteur et de M tuberculosis H37Rv ont ete utilises. Une preuve 
additionnelle du rearrangement a ete obtenue en utilisant un fragment PCR 
de 500 pb englobant la region oriC de H37Rv en tant que sonde marquee au 
32 P pour hybrider les produits de digestion de FADN genomique de M 
tuberculosis, M bovis et M bovis BCG-Pasteur dans les conditions 

25 stringentes decrites precedemment (Philipp et al., 1996). Tandis que dans 
M. bovis et M tuberculosis, une bande d'une taille moyenne d'environ 35 
kb a ete detectee, dans M bovis BCG-Pasteur deux bandes ont hybride 
Fune d'environ 35 kb et Fautre de 29 kb. En conclusion, DU1 correspond a 
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une duplication en tandem de 29668 pb qui resulte en une merodiploidie 
pour la region sigM-pabA (Rv39J 1-R\>0013). 

L'analyse PCR utilisant des amorces a 16,000F (SEQ ID N° 19) ou 
16,500F (SEQ ID N° 20) (amorces sens) et a 4398,770R (SEQ ID N° 21) 
5 (amorce reverse) sur l'ADN genomique de souches variees de BCG 

(Pasteur, Glaxo, Cophenhague, Russie, Prague, Japon) a revele que des 
produits ont seulement ete obtenus a partir de trois souches y compris M. 
bovis BCG-Pasteur. Les trois autres sous-souches ont toujours donne des 
resultats negatifs malgre la confirmation des controles positifs. 
10 Comme attendu, la souche type de M bovis et de M tuberculosis 

H37Rv etaient egaiement toujours negatives. Un resume des donnees de 
cartographie est montre sur la Figure 5. 

La region dnaA-dnaN est regardee de fa?on generate comme 
l'origine de replication fonctionnelle des mycobacteries dans la mesure ou 
15 apres insertion dans des plasmides dont la propre origine de replication est 

manquante, la capacite a se repliquer de fa?on autonome a ete restauree. 
Dans la mesure ou BCG-Pasteur est diploide pour la region dnaA-dnaN, les 
Inventeurs ont etudie s'il existait des differences entre les nucleotides des 
deux copies presentes sur les deux clones BAC X592 et X703. L'analyse de 
20 la sequence de FADN des BAC en utilisant des amorces de regions 
flanquantes et internes de la region intergenique dnaA-dnaN n'a revele 
aucune difference entre les deux copies de la region minimale oriC. De 
plus, ces sequences etaient identiques a celles divulguees dans la litterature 
pour cette souche de BCG. Cette etude suggere que les deux copies de oriC 
25 devraient etre fonctionnelles. 

Mise en evidence de la region dupliquee DU2 
Le deuxieme grand rearrangement genomique observe dans le 
chromosome de M. bovis BCG-Pasteur a ete trouve par l'analyse de 
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plusieurs clones de BAC de BCG couvrant une region genomique d'environ 
200 kb (3 550-3 750 kb). Leurs tailles evaluees par PFGE n'etaient pas 
conformes avec celles attendues a partir du genome de H37Rv et des 
donnees relatives aux sequences terminales. Les comparaisons directes ont 
ete compliquees par la presence d'un element IS6JJ0 dans cette region du 
chromosome de M tuberculosis H37Rv qui a conduit a une petite deletion 
RvD5. 

Les sequences terminales du BAC X495 etaient toutes deux 
localisees aux alentours du site HindHI a 3 594 kb, tandis que les resultats 
PFGE montraient que le clone a une taille d'environ 106 kb, contenant trois 
fragments Hindlll, d'environ 37,5 kb, environ 37 kb et environ 24 kb en 
plus du vecteur. La bande de 24 kb etait d'environ 2 kb plus longue que le 
fragment correspondant Hindlll de 22 kb dans Rv403 . Cette observation a 
conduit a Thypothese que la region genomique aux alentours de 3 594 kb 
devait avoir ete dupliquee, ceci donnant lieu a Introduction d'un nouveau 
site Hindlll la ou le clone X495 prend fin. Pour montrer cela, plusieurs 
amorces dans la region chromosomique de 3 589 kb a 3 594 kb ont ete 
testees pour le sequenfage de PADN du BAC X495 et une jonction 
(JDU2A) a ete identifiee aux bases 3690124/3590900 relativement a la 
sequence genomique de H37Rv. Ceci menait a une interruption du gene 
IpdA (Rv3303) mais les resultats de PCR ont indique qu'une copie intacte 
de ce gene est presente dans la region dupliquee. 

L'analyse systematique d'autres clones dans le voisinage a permis 
Tidentification de 2 BACs independants du BCG (X094 et XI 026) qui 
portaient le meme fragment chromosomal 3 594 a 3 749 kb. Bien que les 
donnees de sequences terminales suggeraient que ces clones devaient avoir 
une taille d'environ 155 kb, la taille estimee par des digestions par Hindlll 
ou Dral suivies d'une separation par PFGE etait seulement d'environ 100 
kb! Cette difference indiquait que les inserts de clones X094 et X1026 
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s'etendaient probablement des sites repetes HindOl a 3 594 kb au site 
authentique Hindlll a la position 3 749 kb, et qu'une deletion interne avait 
eu lieu a l'interieur de l'unite dupliquee. 

Ceci a ete confirme par des experiences d'hybridation dans les 
5 conditions stringentes decrites precedemment sur de l'ADN genomique, 
digere par Hindlll, de M. tuberculosis H37Rv, M. bovis et BCG-Pasteur en 
utilisant de l'ADN du clone X495 radio-marque. La taille de Tune des 
bandes qui s'hybridaient avec cet ADN dans les profils Hindlll de M. 
tubercidosis H37Rv et M bovis etait d'environ 22 kb, tandis que la bande 

10 correspondante dans BCG etait de 24 kb exactement ce qui etait observe 
avec les clones BACs. De plus, les resultats d'hybridation montraient 
qu'une bande de 34 kb dans le profil Hindlll du clone X094 s'hybridait 
egalement avec l'ADN genomique du clone X495, ce qui confirmait que les 
clones X094 et XI 026 contenaient de l'ADN duplique de la region 

15 genomique couverte par X495. Des reactions de PCR et la sequence de 
l'ADN du clone BAC X094 ont permis 1' identification d'un second point de 
jonction JDU2B a une position equivalente a 3 608 471/ 
3 671 535 dans M. tuberculosis H37Rv. Ceci confirmait que DU2 resultait 
d'une duplication directe d'une region de 99 225 pb correspondant aux 

20 sequences entre les positions 3 590 900 et 3 690 124 dans le genome deM. 

tuberculosis H37Rv, et qu'une deletion interne de 63 064 pb avait ensuite 
eu lieu. L'unite residuelle DU2 est ainsi longue de 36 162 pb, ce qui est 
coherent avec les donnees de cartographie, et BCG-Pasteur est diploide 
pour les genes Rv3213c - Rv3230c, et Rv3290c - Rv3302c. 

25 Finalement, des experiences de PCR, de cartographie par PFGE et 

de sequenfage des sequences terminales avec le BAC X094 ont suggere que 
le BCG-Pasteur contenait de l'ADN additionnel dans la region 
chromosomale du site Hindlll 3 691 a 3 749 kb. La comparaison directe 
avec le clone BAC Rv403 de M tuberculosis a permis la mise en evidence 
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de deux sites supplementaires Hindlll dans cette region dans la mesure ou 
les fragments HindlU de 48 kb presents dans Rv403 (correspondant au 
fragment de 3 691 a 3 749) etaient represents par deux bandes de 22 et 36 
kb dans BCG. Cette region du chromosome de M tuberculosis H37Rv 

5 contient une copie de IS6U0 qui n'est pas flanquee des unites repetees 
caracteristiques directes de 3 pb. II est maintenant clair qu'il y avait 
initialement deux copies de IS6JJ0 qui ont servi comme substrat pour un 
evenement de recombinaison. Ceci a donne lieu a la deletion d'un segment 
de 4 kb du genome de M tuberculosis H37Rv (RvD5), qui est toujours 

10 present dans BCG, de meme que dansM bovis et les isolats cliniques de M 
tuberculosis. L' analyse de la sequence de cette region a indique que ce 
fragment de 4 kb contient deux sites Hindlll et qu'il y manque la sequence 
IS61 10 qui est presente a ce site dans M tuberculosis H37Rv. En utilisant 
des amorces internes pour RvD5 (Tableau 4), les Inventeurs ont obtenu des 

15 amplicons avec 1'ADN genomique de toutes les souches de M. bovis BCG 
testees et, la souche de M bovis, de meme qu'avec PADN de clones X094 
et XI 026, mais pas avec les souches de M tuberculosis H37Rv et H37Ra. 

Des experimentations avec de multiples jeux d' amorces 
(3689.500F (SEQ ID N° 22) ou 3689.900F (SEQ ID N° 24) (sens) 

20 3591. 000R (SEQ ID N° 23) , 3591.500R (SEQ ID N° 25) ou 3592.000R 
(reverse)) pour amplifier la region de jonction au niveau de la base 
3690124/3590900 (decrit ci-dessus) dans differentes souches de M bovis 
BCG ont revele que des amplicons pouvaient etre obtenus seulement a 
partir de A/, bovis BCG-Pasteur et a partir de deux autres sous-souches de 

25 BCG, tandis que les autres sous-souches de BCG ne donnaient pas 
d'amplicon. La confirmation des resultats pourra etre faite sur des spots 
Hindlll hybrides avec TADN marque issu de la region 3689500F- 
3690.000R qui devrait donner lieu a des bandes avec des souches de BCG 
rearrangees, Tune d'entre elles presente une taille d'environ 24 kb, environ 
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2 kb de plus que la bande correspondante dans les digestions genomiques de 
M bovis et de M tuberculosis. La seconde bande d'environ 35 kb devrait 
seulement etre presente dans les souches rearrangees et pas dans M. 
tuberculosis H37Rv ou la souche type deM bovis (Figure 6). 
5 Le criblage de clones de 2000 X et XE (Gordon et al., 1999) pour 

des BACs contenant a la fois les jonctions JDU2A et JDU2B, c'est-a-dire 
qui couvrent la region complete rearrangee a permis Identification de trois 
BACs (XI 070, XE377 et XE256) qui ont produit des amplicons avec les 
deux jeux d'amorces. Les inserts ont ete estimes etre respectivement d'une 

10 taille de 95, 86 et 97 kb, par PFGE. Sur la base de ces resultats de PCR, des 
donnees correspondant aux sequences terminales et de la presence de trois 
fragments chromosomaux Hindlll de 37, 36 et 24 kb, les Inventeurs ont 
conclu que le clone XI 070 chevauche le clone X495. Pourtant, il contenait 
un fragment chromosomal Hindlll de 36 kb qui n'etait present ni dans le 

15 clone X495 ni dans le clone X094 et, avec les donnees de sequences 
terminales, ceci suggererait la presence d'une troisieme copie du site 
Hindlll a 3 594 kb dans la region rearrangee. On a obtenu de nouvelles 
preuves de ceci quand les clones XE256 et XE377 isoles d'une banque 
EcoKl dans pBACe3.6, ont ete analyses. En fonction des donnees des 

20 sequences terminales, XE256 s'etend du site EcoKl a 3 597 kb au site 
EcoKl a 3 713 kb, et XE377 du site EcoKl a 3 679 kb au site EcoKl a 3 71 5 
kb. Le fait que ces clones donnaient de fa?on repetee des amplicons pour les 
deux regions de jonction citees JDU2A et JDU2B n'etait pas en accord avec 
leur taille et leurs sequences terminales. Pourtant, ces donnees etaient 

25 coherentes avec le fait que la region de 36 162 pb de DU2 etait presente non 
seulement comme une mais plutot en tant que deux copies en tandem. 
L'hybridation (selon la methode de Philipp et al., 1996) des fragments 
d'ADN digere par Hindlll des clones XE256, X1070 et XE377 avec une 
sonde de 0,5 kb de la region genomique 3 675 kb a confirme les resultats de 
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PCR. Un fragment de 24 kb du clone XI 070 s'hybridait, equivalent de celui 
du clone X495, et un fragment unique de 36 kb qui correspond a une copie 
additionnelle de DU2 etait aussi present. Deux fragments de 33 et 34 kb du 
clone XE256 s'hybridaient a la sonde. Le fragment de 33 kb correspond a 
5 une region qui s'etend du site HindlU present dans le vecteur adjacent au 
site EcoRl de clonage au site HindlU le plus proche dans l'insert 
mycobacterien, tandis que le fragment de 34 kb est identique a celui 
egalement present dans le clone X094. Le fragment de 33 kb chevauchait en 
partie le clone XI 070 tandis que le fragment de 34 kb HindUl etait 

10 identique a celui present dans les clones X094 et XE377. 

Ces donnees indiquaient que deux copies en tandem de DU2 
existent dans le genome de BCG-Pasteur. Ceci a ete confirme par les 
hybridations des produits de digestion par HindlU de 1' ADN genomique de 
BCG-Pasteur, M tuberculosis H37Rv et M. bovis puisque tous 

15 s'hybridaient avec la sonde 3 675. Comme attendu, seulement une bande de 
22 kb a ete observee avec M. tuberculosis et M bovis tandis que trois 
bandes de 24, 34 et 36 kb ont ete detectees, par hybridation, dans le genome 
de BCG-Pasteur. Toutefois, le signal d'hybridation pour le fragment a 36 kb 
etait tres faible. Le fait que les bandes de 24 et 36 kb presentes dans le clone 

20 de BAC XI 070 s'hybrident avec la sonde 3 675 avec la meme intensite, 
alors que celles dans TADN genomique de BCG-Pasteur ne le font pas, 
suggere que seulement une sous-population de la culture de BCG-Pasteur 
contient la seconde copie de DU2. Ainsi, la difference observee dans 
Fintensite d'hybridation peut refleter que la seconde copie de DU2 n'a ete 

25 acquise que recemment et indique que des variants qui contiennent une ou 
deux copie(s) de DU2 existent probablement dans la meme culture de M 
bovis BCG-Pasteur. 

On a obtenu des resultats simil aires avec des fragments d'ADN 
genomique digeres par Xbal de M tuberculosis, M. bovis et BCG-Pasteur 
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qui s'hybridaient avec la sonde 3 675. Dans la digestion de M. tuberculosis 
H37Rv, la sonde 3 675 s'hybridait avec un fragment de 183 kb (position 
genomique 3 646 kb a 3 829 kb). Le fragment correspondant de M bovis 
etait d'a peu pres 178 kb, cette difference de taille etant due a F absence de 
plusieurs elements d' insertion qui ne sont presents que dans le fragment 
genomique de 183 kb de M. tuberculosis H37Rv. Le produit de digestion 
par Xbal de BCG-Pasteur contenait deux fragments de 215 et 250 kb qui 
s'hybridaient avec la sonde 3 675. Ces deux fragments correspondaient au 
fragment de 178 kb observe dans le genome de M bovis augmente par 36 
ou 72 kb en raison de la presence d'une ou de deux copie(s) de DU2. II est 
interessant de noter que le signal d' hybridation pour le fragment de 250 kb 
etait moins intense que le signal obtenu pour le fragment de 215 kb, ce qui 
confirme les observations precedentes avec les produits de digestion par 
Hindlll. 

Ces observations indiquent que cette region du genome de BCG est 
encore dynamique et qu'une sous-population de cellules est triploide pour 
les genes Rv32J3c-Rv3230c, et Rv3290c-Rv3302c. Ces donnees de 
comparaison entre la sequence du genome deM tuberculosis H37Rv et de 
BCG-Pasteur indiquent que BCG-Pasteur devrait etre triploide pour au 
moins 58 genes, et qu'a un point de leur evolution, leur ancetre commun 
contenait des copies dupliquees de 60 genes supplementaires qui ont ete 
perdues lorsque la deletion interne a DU2 a eu lieu. De plus, la presence de 
DU1 et de DU2 et, en particulier la mise en evidence du fait que DU2 soit 
presente sous la forme de deux copies dans une sous-population de BCG- 
Pasteur, suggere que le processus de duplication en tandem dans BCG est 
encore dynamique. 

L' invention fournit done des donnees qui peu vent permettre de 
comparer les differentes souches de BCG entre elles. Par ailleurs, 
Pinvention montre Tinteret d'utiliser les strategies de cartographie par les 
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BACs en tant que complement du sequengage du genome et permet la mise 
en evidence des eventuels inconvenients des projets qui ne sont bases que 
sur le sequenfage de clones par la technique « de coup de fusil ». Ainsi, 
sans cette librairie de BACs, il est tres probable que ces rearrangements 
genomiques complexes presents dans les souches de M, bovis BCG 
n'auraient pas ete detectes. C'est done un avantage de la presente invention 
que de fournir des donnees qui permettent la caracterisation et 
eventuellement les classifications immunogeniques et protectrices, des 
difFerentes souches de BCG aujourd'hui utilisees en clinique et pour des 
applications vaccinales, ainsi que de fournir des elements qui permettent 
F identification specifique de M tuberculosis par rapport a M. bovis et M 
bovis BCG, ou des elements qui permettent Identification specifique de M. 
bovis BCG par rapport a M bovis. La presente invention fournit ainsi des 
elements importants pour l'etude et F epidemiologic de la tuberculose, ainsi 
que pour les prochaines etudes de rearrangements genomiques dans les 
difFerentes bacteries. La technique developpee dans la presente invention 
est exemplifiee par les resultats de la presente invention et peut etre 
appliquee a d'autres genomes bacteriens et/ou de parasites. 

Ainsi, le fait que M bovis BCG-Pasteur et deux autres sous- 
souches de M. bovis BCG ont un jeu completement duplique de genes 
responsables de procedes majeurs tels que, entre autres, la. division 
cellulaire et la traduction du signal, comprenant deux origines de 
replication, est Tun des aspects surprenant revele aux inventeurs par cette 
approche des comparaisons genomiques. 

Puisque le materiel biologique est sujet a changements, et etant 
donne que les essais de vaccination BCG ont donne des resultats tres 
variables de protection (0-80 %), il pourrait etre important d'evaluer si cette 
variation dans l'efficacite de protection peut etre attribute en partie au choix 
de la sous-souche BCG utilisee. 
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II convient done de mener des investigations complementaires afin 
de determiner s'il existe une correlation entre les particularity genomiques 
et les variations phenotypiques parmi les differentes sous-souches de BCG. 

Les banques de BAC ont ete deposees a la Collection Nationale de 
Culture de Microorganismes (CNCM), 25 rue du Dr Roux, 75724 PARIS 
CEDEX 15, France selon les dispositions du Traite de Budapest. 

BAC de M tuberculosis H37Rv Numero d'Ordre 11945 

BAC de M bovis BCG Numero d'Ordre 12049 
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TABLEAU 1: DESCRIPTION DES DELETIONS 



Deletions 


ORF/ 
Gene 


POSITION* DANSLE 
GENOME DE hi. 
TUBERCULOSIS H37RV 


Taille du 
produit 


Fonction PUTATIVE ou famille 




Rv2346c 


2625889-2626170 


94 aa 


Famille de ESAT-6 




Rv2347c 


2626224-2626517 


98 aa 


Famille de QLISS 




Rv2348c 


2626655-2626978 


108 aa 


Inconnue 


| RD5 


plcC 


2627173-2628696 


508 aa 


Phospholipase 




plcB 


2628782-2630317 


512 aa 


Phospholipase 




plcA 


2630538-2632073 


512 aa 


Phospholipase 




Rv2352c 


2632924-2634096 


391 aa 


Proteine PPE 




Rv2353c 


2634529-2635590 


354 aa 


Proteine PPE j 




Rv3425 


3842235-3842762 


176 aa 


Proteine PPE 


RD6 


Rv3426 


3843032-3843727 


232 aa 


Proteine PPE j 




Rv3427c 


3843884-3844636 


251 aa 


Transposase ISJ532 




Rv3428c 


3844737-3845966 


410 aa 


Transposase IS1532 




Rvl964 


2207698-2208492 


265 aa 


Membranaire integrale 




Rvl965 


2208505-2209317 


271 aa 


Membranaire integrale 




Mce3 


2209325-2210599 


425 aa 


Proteine type invasine motif RGD 




Rvl967 


2210599-2211624 


342 aa 


Proteine exportde j 




Rvl968 


2211624-2212853 


410 aa 


Proteine exportee, motif RGD 




Rvl969 


2212853-2214122 


423 aa 


Proteine exportee 




IprM 


2212853-2214122 


377 aa 


Lipoproteine 


RD7 


Rvl971 


2215255-2216565 


437 aa 


Proteine exportee 


Rvl972 


2216590-2217162 


191 aa 


Proteine membranaire 




Rvl973 


2217162-2217641 


160 aa 


Proteine exportde 




Rvl974 


2217657-2218031 


125 aa 


Inconnue 




Rvl975 


2218050-2218712 


221 aa 


Proteine exportde ! 




Rvl976c 


2218845-2219249 


135 aa 


Inconnue 




Rvl977 


2219752-2220795 


348 aa 


Inconnue, signature de liaison Zn 
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TABLEAU 1 (SUITE) 



RD8 


ephA 


4057730-4058695 


322 aa 


Epoxyde hydrolase 1 


Rv3618 


4058695-4059879 


395 aa 


Monooxygenase 


Rv3619c 


: 4059984-4060265 


94 aa 


Famille de ESAT-6 


Rv3620c 


4060295-4060588 


98 aa 


Famille de QLISS 


Rv3621c 


4060648-4061886 


413 aa 


Proteine PPE 


Rv3622c 


4061899-4062195 


99 aa 


Proteine PE 


IpqG 


4062524-4063243 


240 aa 


Lipoproteine 


RD9 


cobL 


2328975-2330144 


390 aa 


Precorrine methylase | 


Rv2073c 


2330215-2330961 


249 aa 


Oxidoreductase 


Rv2074 


2330991-2331401 


137 aa 


Inconnue 


Rv2075 


2331417-2332877 


487 aa 


Proteine ou membranaire exportee 


RD10 


echAi 


265505-266290 


262 aa 


Hydratase enoyl CoA 


Rv0223c 


266302-267762 


487 aa 


Aldehyde deshydrogenase 


RvDl 


RvDl- 
ORF1 


- 


675 aa 


Inconnue 


RvDl- 
ORF2 


- 


318aa 


Inconnue 


Rv2024c 




1606 aa 


Inconnue 




plcD 




514 aa 


Phospholipase 


RvD2 


RvD2- 
ORF1 




394 aa 


Sucre transferase 




RvD2- 
ORF2 




367 aa 


Oxidoreductase 




RvD2- 
ORF3 




945 aa 


Proteine membranaire 




Rvl758 




143 aa 


Cutinase 



* Telle que definie par Cole et al., Nature, 1998, 393, pages 537-544 
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TABLEAU 3:AMORCES PCR 



Deletion 


NOM DE L' AMORCE 


Sequence 


Taille du produit 
attendue 


RD4* 


277-32F 
277-32R 


ACATGTACGAGAGACGGCATGAG 
ATCCAACACGCAGCAACCAG 


H37Rv: 1031 bp 
£>cu. Pas de produit 


RD5* 


lcC-B.5P 
lcC-B.3P 


GATTCCTGGACTGGCGTTG 
CCACCCAAGAAACCGCAf 


H37Rv: 1623 bp 
dCCj. Pas dc produit 


RD6 


78-dell 
78-del2 


ACAAAATCGCCTCGTCGCC 
ACCTGTATTCGTCGTTGrTn a rr 


H37Rv: 8729 bp 
dCG: 3801 bp 


RD7 


v420-flankl.F 
V420-flank2.R 


GGTAATCGTGGCCGACAAG 
CTTGCGGCCCAATnA ATP 


H37Rv: 13068 bp 
BCG: 350 bp 


RD8* 


D8-ephA.F 
D8-ephA.R 


GTGTGATTTGGTGAGACGATG 
GTTCCTCCTG ACT A ATP C A Ofir 


H37Rv: 678 bp 
±JCu: Pas de produit 


RD9 


B2329.5F 
B2332.5R 


CTGCCCGTCGTGCGCGAA 
AGTGGCTCGGCACGCACA 


H37Rv: 3048 bp 
BCG: 1018 bp 


RD10 


D10-264F 
D10-267R 


CGCGAAAGAGGTCATCTAAAC 
GATGCTCAAGCCGTGCACC 


H37Rv: 3024 bp 
BCG: 1121 bp 


j RvDI 


Boli2268469.F 
BoIi2269064.R 


GCGCCACAAACGTACTATCTC 
GTTTCACCGGCTGTCGTTC 


H37Rv: 595 bp 
BCG: 5595 bp 


RvD2 


28-IS6110B.5' 
28-RHS.2 


CCACACCGCAGGATTGGCAAG 
TCGAGTGCATGAACGCAACCGAG 


H37Rv: 2007 bpt 
BCG: 7456 bp 



* = Amorces internes a la deletion 

t = Taille incluant une copie de ISt5//0 non present dans BCG 
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TABLEAU 4: AMORCES POUR L' IDENTIFICATION DES REGIONS 
DUPLIQUEES 



REGION 


NOM DE 
L' AMORCE 


Sequence 


JONCTION DUl 


TB16.0F 
TB16.5F 
TB4398.7R 


GAG CCA ACG ATG ATG ATG ACC 
GGT CAC GGT CGG TGT CGT C 
CAG AAC TGC AGG GGT GGT AC 


JONCTION DU2A 


TB3689.5F 
TB3591.0R 
TB3689.9F 
TB3591.5R 


CTA GTT GTT CAG CCG CGT CTT 
ACC GGG GTG TCG GCC AGT T 
TCG CGG CCA CCG TGC GTA A 
GGC GCC TAT GAC TGA TAC CC 


JONCTION DU2B 


TB3608.0F 
TB3672.0R 
TB3671.7R 


GAA CAG GGT CGC GGA GTC T 
TCG AGG AGG TCG AGT CCT GT 
GGG TTC ATG AGG TGC TAG GG 


AMORCES DE 
DETECTION RvD5 


RvD5-intF 
RvD5-intR 


GGG TTC ACG TTC ATT ACT GTT C 
CCT GCG CTT ATC TCT AGC GG 


SONDE 
D 'HYBRIDATION 
DUl 


TB4411.0F 
TB0.3R 


CCG GCC ACT CAC TGC CTT C 
ACG GTA GTG TCG TCG GCT TC 


SONDE 
D 'HYBRIDATION 
DU2 (sonde 3 675) 


TB3675.0F 
TB3675.5R 


CCA ACA CCG TCA ACT ACT CGA 
ATC GCA GAA CTC CGG CGA CA 


SEQUENCAGE 
DE LA REGION 
dnaA-dnaN 


TB1.2F 
TB1.5F 
TB1.8F 
TB2.2R 


CGA TCT GAT CGC CGA CGC C 
TCC GTC AGC GCT CCA AGC G 
GTC CCC AAA CTG CAC ACC CT 
AAT CCG GAA ATC GTC AGA CCG 
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REVINDICATIONS 



1. Sequences nucleotidiques ou polynucleotides delete(e)s du genome de M 
bovis BCG/M. bovis et present(e)s dans le genome de M. tuberculosis ou 
inversement choisies parmi les ORFs et genes suivants : Rv2346c, 
Rv2347c, Rv2348c, plcC, plcB, plcA, Rv2352c, Rv2353c, Rv3425, 
Rv3426, Rv3427c, Rv3428c, Rvl964, Rvl965, mce3, Rvl967, Rvl968, 
Rvl969, IprM, Rvl971, Rvl972, Rvl973, Rvl974, Rvl975, Rvl976c, 
Rvl977, ephA, Rv36I8, Rv3619c, Rv3620c, Rv3621c, Rv3622c, IpqG, 
cobL, Rv2073c, Rv2074, Rv2075, echAl, Rv0223c, RvDl-ORFl, RvDl- 
ORF2, Rv2024c,/?/cA RvD2-ORFl, RvD2-ORF2, RvD2-ORF3, Rvl758. 

2. Sequences nucleotidiques ou polynucleotides selon la revendication 1 
regroupe(e)s en regions nucleotidiques RD5 a RD10 et RvDl et RvD2 
15 selon la repartition suivante : 

- RD5 : Rv2346c, Rv2347c, Rv2348c, ptcC, plcB, plcA, Rv2352c, 
Rv2353c, 

- RD6 : Rv3425, Rv3426, Rv3427c, Rv3428c, 

- RD7 : Rvl964, Rvl965, mce3, Rvl967, Rvl968, Rvl969, IprM, 
20 Rvl971, Rvl972, Rvl973, Rvl974, Rvl975, Rvl976c, Rvl977, 

- RD8 ephA, Rv3618, Rv3619c, Rv3620c, Rv3621c, Rv3622c, IpqG, 

- RD9 : cobL, Rv2073c, Rv2074, Rv2075c, 

- RD 1 0 : echA J, Rv0223c, 

- RvD 1 : RvD 1 -ORF 1 , RvD 1 -ORF2, Rv2024c, 

25 - RvD2 plcD, RvD2-ORFl, RvD2-ORF2, RvD2-ORF3, Rvl758. 

3. Procede de detection et d'identification discriminante de M bovis BCG / 
M bovis ou M. tuberculosis dans un echantillon biologique, comprenant 
les etapes suivantes : 
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a) isolement de V ADN a partir de l'echantillon biologique a analyser ou 
obtention d'un ADNc a partir de TARN de l'echantillon biologique, 

b) detection des sequences d'ADN de la mycobacterie presente dans 
ledit echantillon biologique, 

c) comparaison desdites sequences avec les sequences nucleotidiques 
ou polynucleotides selon la revendication 1 ou 2. 

Procede selon la revendication 3, dans lequel la detection des sequences 
d'ADN de la mycobacterie est realisee au moyen de sequences 
nucleotidiques complementaires desdites sequences d'ADN. 

Procede selon la revendication 3 ou 4, dans lequel la detection des 
sequences d' ADN de la mycobacterie est realisee par amplification de ces 
sequences a l'aide d' amorces. 

Procede selon la revendication 5, dans lequel les amorces ont une sequence 
nucleotidique choisie dans le groupe comprenant SEQ ID N° 3, SEQ ID 
N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID 
N° 9, SEQ ID N° 10, SEQ ID N° 1 1 SEQ ID N° 12, SEQ ID N° 13, SEQ 
ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID N° 17 et SEQ ID N° 18 

ayec; 

le couple SEQ ID N° 3 / SEQ ID N° 4 specifique de RD5, 
le couple SEQ ID N° 5 / SEQ ID N° 6 specifique de RD6, 
le couple SEQ ID N° 7 / SEQ ID N° 8 specifique de RD7, 
le couple SEQ ID N° 9 / SEQ ID N° 10 specifique de RD8, 
le couple SEQ ID N° 1 1 / SEQ ID N° 12 specifique de RD9, 
le couple SEQ ID N° 13 / SEQ ID N° 14 specifique de RD10, 
le couple SEQ ID N° 15 / SEQ ID N° 16 specifique de RvDl, et 
le couple SEQ ID N° 1 7 / SEQ ID N° 1 8 specifique de RvD2, 
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7. Procede selon la revendication 6, dans lequel le groupe dans lequel les 
amorces sont choisies comprend en outre les sequences nucleotidiques 
SEQ ED N° 1 et SEQ ED N° 2, le couple SEQ ID N° 1 / SEQ ID N° 2 etant 
specifique de RD4. 

8. Procede de detection et d' identification discriminante de M. bovis BCG / 
M bovis ou M tuberculosis dans un echantillon biologique, comprenant 
les etapes suivantes : 

a) mise en contact de l'echantillon biologique a analyser avec au moins 
un couple d'amorces tel que defini dans la revendication 6 ou 7, PADN 
contenu dans l'echantillon ayant ete, le cas echeant, prealablement rendu 
accessible a F hybridation, 

b) amplification de P ADN de la mycobacterie, 

c) mise en evidence de Pamplification des fragments d'ADN. 

9. Kit pour la detection et P identification discriminante de M bovis BCG I M. 

bovis ou M tuberculosis dans un echantillon biologique comprenant les 
elements suivants : 

a) au moins un couple d'amorces tel que defini dans la revendication 6 
ou 7, 

b) les reactifs necessaires pour efFectuer une reaction d'amplification 
d'ADN, 

c) eventuellement, les elements necessaires permettant de verifier ou 
comparer la sequence et/ou la taille du fragment amplifie. 

10. Utilisation d'au moins un couple d'amorces tel que defini dans la 
revendication 6 ou 7 pour Pamplification de sequence d'ADN deM bovis 
BCG / M. bovis ou M. tuberculosis. 
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11. Produits cT expression de tout ou partie des sequences nucleotidiques ou 

polynucleotides delete(e)s du genome de M. bovis BCG / M. bovis et 
present(e)s dans M tuberculosis ou inversement tel(le)s que defini(e)s 
5 dans la revendication 1 . 

12. Procede de detection discriminante in vitro d'anticorps diriges contre 
M bovis BCG / M bovis ou M tuberculosis dans un echantillon 
biologique, comprenant les etapes suivantes : 

10 a) mise en contact de Techantillon biologique avec au moins un produit 

tel que defini dans la revendication 11, 

b) mise en evidence du complexe antigene - anticorps forme. 

13. Procede de detection discriminante d'une vaccination avec M. bovis BCG 
15 ou d'une infection par M tuberculosis chez un mammifere, comprenant 

les etapes suivantes : 

a) preparation d'un echantillon biologique contenant des cellules, plus 
particulierement, des cellules du systeme immunitaire dudit mammifere et 
plus particulierement encore, des cellules T, 
20 b) incubation de l'echantillon biologique de Tetape a) avec au moins un 

produit tel que defini dans la revendication 11, 

c) detection d'une reaction cellulaire indiquant une sensibilisation 
prealable du mammifere audit produit, notamment la proliferation 
cellulaire et/ou la synthese de proteines telles que 1* interferon gamma. 

25 

14. Kit pour le diagnostic in vitro d'une infection par M tuberculosis chez un 
mammifere eventuellement prealablement vaccine avec M bovis BCG, 
comprenant : 

a) un produit tel que defini dans la revendication 1 1, 
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b) le cas echeant, les reactifs pour la constitution du milieu propice a la 
reaction immunologique, 

c) les reactifs permettant la detection des complexes antigene - 
anticorps produits par la reaction immunologique, 

5 d) le cas echeant, un echantillon biologique de reference (temoin 

negatif) depourvu d' anticorps reconnus par ledit produit, 
e) le cas echeant, un echantillon biologique de reference (temoin 
positif) contenant une quantite predeterminee d'anticorps reconnus par 
ledit produit. 

10 

15. Anticorps mono- ou polyclonaux, leurs fragments ou anticorps 
chimeriques, caracterises en ce qu'ils sont capables de reconnaitre 
specifiquement un produit tel que defini dans la revendication 1 1 . 



15 16. Procede pour la detection discriminante de la presence d'un antigene de M 
bovis BCG / M. bovis ou de M. tuberculosis dans un echantillon 
biologique comprenant les etapes suivantes : 

a) mise en contact de l'echantillon biologique avec un anticorps selon la 
revendicationlS, 

20 b) mise en evidence du complexe antigene - anticorps forme. 

17. Kit pour la detection discriminante de la presence d'un antigene de 
M bovis BCG / M bovis ou de M tuberculosis dans un echantillon 
biologique comprenant les etapes suivantes : 
25 a) un anticorps tel que defini dans la revendication 1 5, 

b) les reactifs pour la constitution du milieu propice a la reaction 
immunologique, 

c) les reactifs permettant la detection des complexes antigene - 
anticorps produits par la reaction immunologique. 
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18. Composition immunogene caracterisee en ce qu'elle comprend au moins 
un produit tel que defini par la revendication 11. 

5 19. Vaccin caracterise en ce qu'il comprend au moins un produit tel que defini 
dans la revendication 11 en association avec un vehicuie 
pharmaceutiquement compatible et, le cas echeant, un ou plusieurs 
adjuvants de Fimrnunite appropries. 

10 20. Procede de detection et d' identification discriminante deM bovis BCG ou 
M tuberculosis dans un echantillon biologique comprenant les etapes 
suivantes : 

la digestion par Hindlll d'au moins une partie du genome de la 
mycobacterie presente dans 1' echantillon biologique a analyser, et 
15 - T analyse des fragments de restriction ainsi obtenus. 

21. Procede selon la revendication 20, dans lequel l'analyse des fragments de 

restriction consiste a compter lesdits fragments et/ou a determiner leur 
longueur. 

20 

22. Procede de detection selon Tune des revendications 20 ou 21, dans lequel 

l'analyse des fragments de restriction consiste a les mettre en contact avec 
au moins une sonde dans des conditions d'hybridation stringentes et a 
identifier les parties de fragments ou fragments hybrides. 

25 

23. Procede selon la revendication 22, caracterise en ce que la sonde est 

obtenue par amplification de I'ADN genomique avec les amorces choisies 
dans le groupe SEQ ID N° 31, SEQ ID N° 32, SEQ ID N° 33 ou SEQ ID 
N° 34 avec le couple : 
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- SEQ ID N° 3 1 / SEQ ID N° 32 specifique de DU1 

- SEQ ID N° 33 / SEQ IDN ° 34 specifique de DU2 

4. Precede selon la revendication 20, caracterise en ce que l'on effectue une 
amplification des fragments obtenus avec des amorces choisies dans le 
groupe SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, 
SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 
27 et SEQ ID N° 28avec : 

- SEQ ID N° 19, SEQ ID N° 20 / SEQ ID N° 21 specifiques de JDU1 

- SEQ ID N° 22, SEQ ID N° 24 / SEQ ID N° 23, SEQ ID N° 25 
specifiques de JDU2A 

- SEQ ID N° 26 / SEQ ID N° 27, SEQ ID N° 28 specifiques de 
JDU2B 

. Precede selon la revendication 20, caracterise en ce que les fragments 
obtenus sont amplifies avec des amorces choisies dans le groupe SEQ ID 
N° 35, SEQ ID N° 36, SEQ ID N° 37 et SEQ ID N° 38 specifiques de DU1 
puis analyses par sequenpage. 
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LI STAGE DE SEQUENCE 

<110> INSTITUT PASTEUR 

<120> Sequences deletees chez M bovi^ nrr/M k~ ■ 

de detection d es n.ycobact.ries^t^Lfces ' sT^LTs £ ITaTn^ 5 ' 
<130> D18014 
<160> 38 

<170> Patentln Vers. 2.0 

<210> 1 
<211> 24 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> Y277-32F 
<400> 1 

gacatgtacg agagacggca tgaq 

24 

<210> 2 
<211> 21 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> Y277-32R 
<400> 2 

aatccaacac gcagcaacca q 

21 

<210> 3 
<211> 20 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> plcC-B.5P 
<400> 3 

ggattcctgg actggcgttg 

20 

<210> 4 
<211> 19 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> plcC-B.3P 
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<400> 4 

cccacccaag aaaccgcac 

<210> 5 
<211> 20 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> Y78-dell 
<400> 5 

aacaaaatcg cctcgtcgcc 20 

<210> 6 
<211> 24 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> Y78-del2 
<400> 6 

aacctgtatt cgtcgttgct gacc 24 " 

<210> 7 
<211> 20 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> Rv420-flankl.F 
<400> 7 

tggtaatcgt ggccgacaag 20 

<210> 8 
<211> 19 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> RV420-flank2.R 
<400> 8 

tcttgcggcc caatgaatc 19 

<210> 9 
<211> 22 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> RD8-ephA.F 
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3 



<400> 9 

ggtgtgattt ggtgagacga tg 

<210> 10 
<211> 23 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> RD8-ephA. R 
<400> 10 

agttcctcct gactaatcca ggc 

<210> 11 
<211> 19 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> TB2329.5F 
<400> 11 

tctgcccgtc gtgcgcgaa 

<210> 12 
<211> 19 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> TB2332.5R 
<400> 12 

cagtggctcg gcacgcaca 

<210> 13 
<211> 22 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 

<223> RD10-264F 
<400> 13 

tcgcgaaaga ggtcatctaa ac 

<210> 14 
<211> 20 
<212> ADN 

<213> Mycobacterium tuberculosis 
<220> 



22 



23 



19 



19 



22 
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4 



<223> RD10-267R 
<400> 14 

agatgctcaa gccgtgcacc 20 

<210> 15 
<211> 22 
<212> ADN 

<213> Mycobacterium bovis 
<220> 

<223> TBoli2268469. F 
<400> 15 

cgcgccacaa acgtactatc tc 22 

<210> 16 

<211> 20 

<212> ADN 

<213> Mycobacterium bovis 
<220> 

<223> TBoli2269064.R 

<400> 16 

agtttcaccg gctgtcgttc 20 

<210> 17 
<211> 22 
<212> ADN 

<213> Mycobacterium bovis 
<220> 

<223> Y28-IS6110B.5' 
<400> 17 

cccacaccgc aggattggca ag 22 

<210> 18 
<211> 24 
<212> ADN 

<213> Mycobacterium bovis 
<220> 

<223> Y28-RHS.2 
<400> 18 

atcgagtgca tgaacgcaac cgag 24 



<210> 19 
<211> 21 
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<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB16.0F 
<400> 19 

gagccaacga tgatgatgac c 

<210> 20 
<211> 19 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB16.5F 
<400> 20 

ggtcacggtc ggtgtcgtc 

<210> 21 
<211> 20 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB4398.7R 
<400> 21 

cagaactgca ggggtggtac 

<210> 22 
<211> 21 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB3689.5 
<400> 22 

ctagttgttc agccgcgtct t 

<210> 23 
<211> 19 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB3591.0R 
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<400> 23 

accggggtgt cggccagtt 



19 



<210> 24 
<211> 19 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB3689.9F 
<400> 24 

tcgcggccac cgtgcgtaa 19 



<210> 25 
<211> 20 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB3591.5R 



<210> 26 
<211> 19 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB3608.0F 
<400> 26 

gaacagggtc gcggagtct 19 

<210> 27 
<211> 20 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB3672.0R 



<400> 25 



ggcgcctatg actgataccc 



20 



<400> 27 

tcgaggaggt cgagtcctgt 



20 



<210> 28 
<211> 20 
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<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB3671.7R 
<400> 28 

gggttcatga ggtgctaggg 

<210> 29 
<211> 22 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> RvD5-intF 
<400> 29 

gggttcacgt tcattactgt tc 

<210> 30 
<211> 20 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> RvD5-intR 
<400> 30 

cctgcgctta tctctagcgg 

<210> 31 
<211> 19 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB4411.0F 
<400> 31 

ccggccactc actgccttc 

<210> 32 
<211> 20 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB0.3R 
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<400> 32 

acggtagtgt cgtcggcttc 



20 



<210> 33 
<211> 21 
<212> ADN 



<213> Mycobacterium bovis BCG 



<220> 

<223> TB3675.0F 



<400> 33 



ccaacaccgt caactactcg a 



21 



<210> 34 
<211> 20 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB3675.5R 
<400> 34 

atcgcagaac tccggcgaca 20 



<210> 35 
<211> 19 
<212> ADN 

<213> Mycobacterium bovis BCG 



<210> 36 
<211> 19 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB1.5F 
<400> 36 

tccgtcagcg ctccaagcg 19 



<220> 

<223> TB1.2F 



<400> 35 

cgatctgatc gccgacgcc 



19 



<210> 37 
<211> 20 
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<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB1.8F 
<400> 37 

gtccccaaac tgcacaccct 



<210> 38 
<211> 21 
<212> ADN 

<213> Mycobacterium bovis BCG 
<220> 

<223> TB2.2R 
<400> 38 

aatccggaaa tcgtcagacc g 
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